Robot dostal fotky místností vyfocené na iPhonu. Potom v místnosti prováděl úkoly

Tým robotiků z New York University ve spolupráci s kolegou z oddělení AI ze společnosti Meta vyvinul robota, který je schopen vyzvednout určené předměty v neznámé místnosti a umístit je na nové určené místo. Výzkumníci poznamenali, že vizuální jazykové modely (VLM) za posledních několik let velmi pokročily a staly se velmi dobrými v rozpoznávání objektů na základě jazykových výzev.