26. 2. 2023

Bitva mezi lidmi a stroji: Amatér porazil špičkový program KataGo pomocí taktiky nesmyslných tahů

Od roku 2017 zuří mezi lidmi a počítači tichá bitva o to, kdo ovládne japonskou hru Go. A donedávna měla jednoznačně navrch umělá inteligence, konkrétně program AlphaGo, který dokázal porazit lidského šampiona, jak píše server IFL Science. Karta se ale nečekaně obrátila.

Nejlepším hráčem na světě v deskové hře Go je algoritmus, který se hru navíc sám naučil hrát. AlphaGo Zero společnosti Google se stal mistrem světa v této hře za pouhé tři dny, když úplně zničil své profesionální lidské konkurenty, kteří se hře Go věnovali dlouhé roky. AlphaGo dokázal porazit i svou předchozí verzi, která přehrála všechny lidské světové šampiony. Porazil i svou vlastní verzi, která zvítězila v roce 2017 nad mistrem světa Lee Sedolem. AlphaGo porazil své starší já výsledkem 100:0. Zdálo se, že lidem v této hře navždy ujel vlak.

Letos ale zástupce lidského pokolení strojům tuto potupnou porážku vrátil. Průměrný amatérský hráč Kellin Perline dokázal porazit jiný mimořádně vyspělý program KataGo ve 14 z 15 her.

Jak lidé dosáhli tohoto comebacku? Bohužel je potřeba přiznat, že k tomu opět pomohly stroje. Skupina vědců, která naprogramovala KataGo, následně sestavila program, aby hledali slabiny v jeho algoritmech. Doslova mu tak vytvořila počítačové protivníky, kteří se ho snažili porazit. A těm se začalo dařit. Výsledky zápasů a použité strategie se dostaly k amatérskému hráči Kellinu Pelrinovi.

Ten zjistil, že KataGo nedokázal reagovat na zdánlivě nesmyslné tahy soupeře. Zatímco v první fázi hry se klasicky snažili oba soupeři navzájem obklíčit kameny, ve druhé části soupeř mátl KataGo tím, že své kameny „nesmyslně“ umisťoval do odlehlých částí šachovnice. KataGo se na tuto strategii nedokázal adaptovat a prohrál s Pelrinem v 14 z 15 partií.

Není to ovšem porážka v pravém slova smyslu, Pelrin pouze využil chybu v programu, herní terminologií by se dalo říci bug, který prostě zavedl program do slepé uličky a ten nebyl schopen nad svým lidským soupeřem zvítězit. Stejnou taktiku použil Pelrine i k poražení dalšího programu Leela Zero. I ten byl bezbranný při zvládání taktiky nesmyslných tahů. Přitom i pro naprosto průměrného lidského hráče by taková taktika neznamenala žádný problém, protože by chápal nesmyslnost tahů. Program je ale takto nedokázal vyhodnotit.

Nejde však jen o samotnou hru Go, celá věc má podle expertů hlubší pozadí. Podle Stuarta Russella, profesora informatiky na Kalifornské univerzitě v Berkeley, odhalení takové chyby u některých nejpokročilejších strojů na hru Go naznačuje zásadní problém u současných systémů hlubokého učení. Ukazuje se, že algoritmy mohou „rozumět“ pouze konkrétním situacím, kterým byly v minulosti vystaveny, a nemohou zobecňovat a učit se způsobem, který je pro člověka snadný.

„Opět se ukazuje, že jsme se příliš unáhlili, když jsme strojům přisoudili nadlidskou úroveň inteligence,“ řekl Russell.

Zdroje: iflscience.com, wonderfulengineering.com