26 април, 2024

Ново проучване на учени от Carnegie Mellon University успява да докаже силата на AI програма с името “Pluribus”. Алгоритъмът може да се справя в сложни ролеви ситуации с повече от двама играчи и доказва своето надмощие в игра на Texas hold’em покер с 6-ма души. По думи на своите създатели, идеята може да се разрастне и да открие приложение в сложни военностратегически сутации, както и да открива решения, свързани с киберсигурността и здравето на хората.

Др. Пуруш, който е участник в проекта споделя: “Всичко е в стратегията. Скалируемостта винаги е била ограничаващият фактор в теорията на игрите. Покерът е достъпен пример, който показва как тези математически модели могат да бъдат използвани за изработване на стратегии в ситуации, в които някой човек не притежава пълната информация – не могат да се предвидят действията на противниците, нито пък техните възможности”.

Резултати при игра с 5-ма души и 1 AI: “Top: The lines show the win rate (solid line) plus or minus the standard error (dashed lines). Bottom: The lines show the cumulative number of chips won (solid line) plus or minus the standard error (dashed lines). The relatively steady performance of Pluribus over the course of the 10,000-hand experiment suggests the humans were unable to find exploitable weaknesses in the bot.”

В един от експериментите наречен “1 човек срещу 5 AI” са включени двама покер играчи – Крис “Исус” Фъргюсън и Дарън Илиъс. Всеки един от тях собственоръчно е играл 5,000 раздавания срещу 5 AI копия на Pluribius при следните условия:

  • Алгоритъмът не знае срещу кого играе (дали срещу свое копие или срещу човек) и не може да адаптира стратегии срещу определен човек, нито пък да обедини силите на всичките 5 AI срещу човека
  • За стимул всеки от играчите (хора) получава 2,000$ за включване в симулацията и още 2,000$, ако играе по-добре от изкуствения интелект
  • Нито един от участниците не знае нищо за останалите играчи, нито пък как се справя другия играч – човек

Очваквано – за общо 10,000 разиграни ръце в повечето случаи Pluribus бие хората.

Как работи?

Алгоритъмът отхвърля всички гаранции за успех и победа, които са само на теория. Той, обаче, успява да си разработи стратегии, с които да надхитри опонентите и да погледне с няколко хода напред (но не и да предвижда края на играта). Основното преимущество на алгоритъма е търсенето и изчисленията при условия с ограничена и почти неизвестна информация.

Извън покер масата

Проучването, което е финансирано главно от Армията в САЩ, може да послужи и за далеч по-важни цели. Учените твърдят, че чрез модифициране на получената техника е възможно прилагане на т.нар. “био-управление”, при което изследователите да създават планове за лечение, да управляват имунната система на пациенти и да се борят по-добре с рак, автоимунни заболявания, инфекции и други.

Прочетете подробно за разработката тук.

Тагове: , , , ,