Umělá inteligence si zřejmě vytvořila svůj vlastní tajný jazyk
Nová generace modelů umělé inteligence (AI), jako jsou Imagen, MidJourney a DALL-E 2, dokáže na základě textových podnětů vytvářet „kreativní“ obrázky na vyžádání. Vědci v USA přišli se zajímavým tvrzením, že model DALL-E 2 možná vynalezl vlastní tajný jazyk pro definování objektů, jak píše server Science Alert.
Poté, co výzkumníci vyzvali umělou inteligenci DALL-E 2 k vytvoření obrázků s textovými popisky a následně vložili výsledné popisky (hlouposti) zpět do systému, dospěli k závěru, že DALL-E 2 si myslí, že Vicootes znamená „zelenina“, zatímco Wa ch zod rea se vztahuje k mořským tvorům, které by mohla sežrat velryba.
Má umělá inteligence DALL-E 2 tajný jazyk?
Pravděpodobně ne, není to „tajný jazyk“, spíše by se dalo říci, že má svůj vlastní slovník, ale ani to nemůžeme vědět s jistotou. V této fázi je velmi obtížné ověřit jakákoli tvrzení o DALL-E 2 a dalších velkých modelech umělé inteligence, protože k nim má přístup jen hrstka výzkumníků. Všechny zveřejněné snímky je třeba brát s velkou rezervou, protože jsou „vybírány“ lidmi z mnoha výstupních snímků generovaných umělou inteligencí. Co se děje? Jednou z možností je, že „hloupé“ fráze souvisejí se slovy z jiných jazyků než angličtiny.

Například slovo Apoploe, které zřejmě souvisí s obrazy ptáků, je podobné latinskému Apodidae, což je název čeledi ptačích druhů. To by mohlo být pravděpodobné vysvětlení. Například program DALL-E 2 byl vycvičen na velmi široké škále dat získaných z internetu, která obsahovala mnoho neanglických slov. K podobným věcem docházelo již dříve: velké modely umělé inteligence zaměřené na přirozený jazyk se zřejmě náhodně naučily psát počítačový kód bez záměrného tréninku. Tuto teorii podporuje skutečnost, že jazykové modely umělé inteligence nečtou text stejně jako my lidé.
Vstupní text před zpracováním rozdělí na tokeny. Přitom různé přístupy k tokenizaci mají různé výsledky. Zdá se, že je to intuitivní přístup, ale problémy mohou nastat, pokud mají stejné tokeny (slova) více různých významů. Na druhou stranu, pokud se s každým slovem zachází jako s tokenem, vzniká menší počet možných tokenů, ale každý z nich poskytuje mnohem méně významných informací. DALL-E 2 používá přístup nazývaný kódování párů bajtů (BPE). Kontrola reprezentací BPE pro některá nesmyslná slova naznačuje, že by to mohl být důležitý faktor pro pochopení tajného jazyka.

Tajný jazyk je důsledkem toho, že DALL-E 2 nemůže říct „nevím, o čem mluvíš“
A proto vždy vygeneruje nějaký obrázek z daného vstupního textu. Nic z toho však plně nevysvětluje, co se děje. Zdá se například, že odstranění jednotlivých znaků z nesmyslných slov poškozuje generované obrázky velmi specifickým způsobem. A také se zdá, že jednotlivá nesmyslná slova se nemusí nutně spojovat do souvislých složených obrazů.
Možná si říkáte, jestli je to všechno opravdu důležité. Odpověď zní ano. Tajný jazyk umělé inteligence DALL-E je příkladem útoku proti systému strojového učení, což je způsob, jak narušit zamýšlené chování systému záměrným výběrem vstupů, které umělá inteligence nezvládá dobře. Jedním z důvodů, proč jsou útoky protistrany znepokojivé, je to, že zpochybňují naši důvěru v model. Pokud umělá inteligence interpretuje nesmyslná slova nezamýšleným způsobem, může také interpretovat smysluplná slova.
Vyvolává to také obavy o bezpečnost. Umělá inteligence DALL-E 2 filtruje vstupní text, aby uživatelé nevytvářeli škodlivý nebo urážlivý obsah, ale „tajný jazyk“ nesmyslných slov může uživatelům umožnit tyto filtry obejít. Nedávný výzkum odhalil neintuitivní „spouštěcí fráze“ pro některé jazykové modely umělé inteligence.
A konečně, fenomény jako tajný jazyk umělé inteligence DALL-E 2 vyvolávají obavy ohledně interpretovatelnosti. Chceme, aby se tyto modely chovaly tak, jak lidé očekávají, ale pokud vidíme strukturovaný výstup v reakci na nesmysly, jsme zmateni. Dokud nebudou tyto systémy dostupnější (zejména dokud je nebudou moci používat uživatelé z širšího spektra neanglického kulturního prostředí), nebudeme schopni skutečně zjistit, co se děje.
Zdroj: sciencealert.com
Nejnovější články
- Jeden nespokojený senior může zablokovat stavbu celého satelitního městečka o několika domech
- Kalifornie testuje autobusy s rychlostí 225 km/h. Pro svou zběsilou jízdu budou mít vlastní pruh na dálnici
- Některé České restaurace trestají nedojedená jídla poplatkem. Kdo nedojí, připlatí si
- Cyklistický airbag může být rozhodujícím prvkem pro záchranu života. Objevují se hlasy pro jeho povinné zavedení
- Ukrajina tak dlouho žádala USA o zbraně dlouhého doletu, až se je naučila vyrábět sama
- Psychologie říká, že lidé, kteří dosáhnou 70 let a uvědomí si, že je jejich děti již nepotřebují, mohou pociťovat hluboký dopad na své duševní zdraví
- Zpráva evropských úřadů potvrzuje: hrozny, jahody a pomeranče jsou ovoce nejvíce kontaminovány pesticidy
- Kbelík a mop mají své dny sečteny: odborníci na úklid sdílejí stejný názor a v roce 2026 se přiklánějí k jeho vylepšené verzi
- Blíží se úplné zatmění slunce: Dočkáme se ho v létě a bude to nádherná podívaná
- Je konec: Legendární švédská automobilka po 75 letech končí prodejem posledních vyrobených aut