Roboti budou inteligentnější. Inženýři využívají psychologii, fyziku a geometrii k jejich výrobě

Roboti jsou všude kolem nás, od dronů natáčejících videa na obloze až po servírování jídla v restauracích a zneškodňování bomb v případě nouze. Proto inženýři využívají psychologii, fyziku a geometrii k výrobě inteligentnějších robotů, jak píše web Tech Xplore.

Roboti pomalu, ale jistě zlepšují kvalitu lidského života tím, že rozšiřují naše schopnosti, uvolňují čas a zvyšují naši osobní bezpečnost a pohodu. Zatímco stávající roboti jsou stále zdatnější v jednoduchých úkolech, vyřizování složitějších požadavků bude vyžadovat další vývoj v oblasti mobility i inteligence.

Počítačoví vědci z firmy Columbia Engineering a institutu Toyota Research se zabývají psychologií, fyzikou a geometrií, aby vytvořili algoritmy, které umožní robotům přizpůsobit se svému okolí a naučit se dělat věci samostatně. Tato práce má zásadní význam pro to, aby roboti mohli řešit nové výzvy vyplývající ze stárnutí společnosti a poskytovat lepší podporu zejména seniorům a lidem se zdravotním postižením.

Výuka robotů okluze a permanence objektů

Dlouhodobou výzvou v počítačovém vidění je stálost objektu, což je v psychologii dobře známý koncept, který zahrnuje pochopení, že existence objektu je oddělena od toho, zda je v daném okamžiku viditelný. Pro roboty je zásadní, aby porozuměli našemu neustále se měnícímu, dynamickému světu. Většina aplikací počítačového vidění však okluze zcela ignoruje a má tendenci ztrácet přehled o objektech, které se dočasně skryjí z dohledu.

„Některé z nejtěžších problémů umělé inteligence jsou pro člověka ty nejjednodušší,“ řekl Carl Vondrick, docent informatiky a držitel ceny institutu Toyota Research. Vzpomeňte si, jak si batolata hrají na kukátko a učí se, že jejich rodič nezmizí, když si zakryje obličej. Počítače naproti tomu ztrácejí přehled, jakmile je něco zakryto nebo skryto z dohledu, a nedokážou zpracovat, kam se předmět poděl, nebo si vybavit jeho polohu.

Aby tento problém vyřešili, naučili Vondrick a jeho tým neuronové sítě základní fyzikální pojmy, které jsou pro dospělé a děti přirozené. Podobně jako se dítě učí fyziku tím, že sleduje dění ve svém okolí, vytvořil tým stroj, který sleduje mnoho videí, aby se naučil fyzikální pojmy. Klíčovou myšlenkou je naučit počítač předvídat, jak bude scéna vypadat v budoucnosti. Tím, že stroj trénuje řešení tohoto úkolu na mnoha příkladech, si automaticky vytvoří vnitřní model toho, jak se objekty fyzicky pohybují v typickém prostředí. Když například zmizí plechovka s limonádou z dohledu uvnitř lednice, stroj se naučí pamatovat si, že stále existuje, protože se znovu objeví, jakmile se dveře lednice znovu otevřou.

„S obrázky a videem jsem pracoval už dříve, ale přimět neuronové sítě, aby dobře pracovaly s trojrozměrnými informacemi, je překvapivě složité,“ řekl Basile Van Hoorick, student třetího ročníku doktorského studia, který s Vondrickem pracoval na vývoji rámce, jenž dokáže porozumět okluzím v okamžiku jejich vzniku, jak se píše v této studii. Na rozdíl od lidí není pro počítače pochopení trojrozměrnosti našeho světa přirozené.

Překročení předpokladu tuhého tělesa

Většina dnešních robotů je naprogramována s řadou předpokladů pro jejich fungování. Jedním z nich je předpoklad tuhého tělesa, který předpokládá, že objekt je pevný a nemění svůj tvar. A to spoustu věcí zjednodušuje. Tim, co pracují s roboty, mohou zcela ignorovat fyziku objektu, se kterým robot komunikuje, a musí přemýšlet pouze o pohybu robota.

Laboratoř umělé inteligence a robotiky na Kolumbijské univerzitě (CAIR), kterou vede odborný asistent informatiky Shuran Song, zkoumá pohyb robotů jiným způsobem. Její výzkum se zaměřuje na deformovatelné, netuhé objekty – skládají se, ohýbají a mění tvar. Při práci s deformovatelnými objekty se ti, co pracují s roboty, již nemohou spoléhat na předpoklad tuhého tělesa, což je nutí znovu přemýšlet nad fyzikou.

„V naší práci se snažíme zkoumat, jak lidé intuitivně dělají věci,“ řekla Shuran Song, rovněž držitelka ocenění insitutu Toyota Research. Místo snahy zohlednit všechny možné parametry vyvinul její tým algoritmus, který robotovi umožňuje učit se z činnosti, což mu umožňuje větší zobecnění a snižuje potřebu obrovského množství tréninkových dat.

To skupinu přinutilo přehodnotit způsob, jakým lidé provádějí určitou činnost, například zasažení cíle lanem. Obvykle nepřemýšlíme o trajektorii provazu – místo toho se snažíme nejprve zasáhnout objekt a upravujeme své pohyby, dokud nejsme úspěšní. „Tento nový pohled byl pro řešení tohoto obtížného problému v robotice nezbytný, poznamenala Song.

Zdroj: Tech Xplore, Kolumbijská univerzita inženýrství a aplikované vědy, arxiv.org