Umělá inteligence se naučila vyjednávat, blafovat, strategicky myslet a uzavírat dohody

Vědci ze společnosti Meta vytvořili umělou inteligenci, která je schopna hrát hru Diplomacie a porazit většinu lidských hráčů. Jak společnost Meta, diplomacie byla po desetiletí považována za „téměř nepřekonatelně velkou výzvu pro umělou inteligenci“. Cílem hry Diplomacie je ovládnout většinu hrací plochy, což se děje prostřednictvím vzájemného vyjednávání, uzavírání aliancí, dohod a zjišťování, kdy ostatní hráči blafují.

Společnost Meta vytvořila a vycvičila umělou inteligenci s názvem CICERO, která patří mezi 10 % nejlepších hráčů Diplomacie, kteří odehráli více než jednu hru. Toho bylo dosaženo spojením dvou různých oblastí výzkumu umělé inteligence: strategického uvažování a zpracování přirozeného jazyka. Pomocí těchto dvou modelů může CICERO předvídat tahy, které pravděpodobně provedou ostatní hráči, a také tahy, které si hráči myslí, že CICERO provede (strategické uvažování).

CICERO pak používá sadu pečlivě vybraných plánů, na nichž zakládá konverzaci s ostatními hráči, aby vyjednával, nabízel rady, sdílel informace a uzavíral dohody. Umělá inteligence, která dokáže porazit nejlepší hráče ve hrách, jako jsou šachy, poker nebo go, je trénována pomocí posilování učení.

Protože diplomacie vyžaduje spolupráci s lidskými hráči, tato metoda nefunguje. Obvykle se v takových hrách používá učení pod dohledem, ale podle společnosti Meta to vytváří relativně slabého a vysoce zneužitelného protivníka. Místo toho společnost Meta použila iterativní plánovací algoritmus, který vyvažuje konzistenci dialogu s racionalitou.

Ačkoli CICERO není zdaleka dokonalé a občas přináší nekonzistentní dialogy, je dostatečně dobré na to, aby představovalo vážnou výzvu i pro ty nejlepší hráče hry. Společnost Meta se však domnívá, že technologie vyvinuté na základě této umělé inteligence lze dobře využít i jinde. Umožní například hlasovým asistentům vést s námi dlouhé rozhovory a učit nás novým dovednostem.

Zdroj: redakce, ai.facebook.com, pcmag.com