Aplikace společnosti Adobe využívá umělou inteligenci k tomu, aby byla rozmazaná videa ostrá a jasná

Tým inženýrů zabývajících se videem a umělou inteligencí ve společnosti Adobe Research vyvinul aplikaci s umělou inteligencí nazvanou VideoGigaGAN, která dokáže přijmout rozmazané video a vylepšit ho tak, aby bylo mnohem plastičtější. O aplikacích umělé inteligence se v poslední době hodně mluví, především díky vydání jazykových modelů, jako je ChatGPT, které mohou spotřebitelé používat k vytváření nejrůznějších výstupů. Výzkum AI však probíhá i v dalších oblastech, například při vytváření umělých obrázků a videí.

V tomto novém úsilí vytvořil tým společnosti Adobe aplikaci, která dokáže přijmout rozmazaný vzorek videa a po zpracování vrátit stejný vzorek s výrazně zvýšenou ostrostí a jasností – známý také jako upscaling. Nazývá se VideoGigaGAN – název pochází z dříve předvedené aplikace GigaGAN, která generovala nové fotografie nebo vylepšovala staré. GAN je zkratka pro generativní adverzní síť.

Jak už název napovídá, tým použil generativní adverzní síť, aby systém naučil, jak vypadá ostré a jasné video (například jednotlivé chloupky v obočí, a ne rozmazaná hmota), a poté přidal „modul propagace řízené tokem“, který udržuje konzistenci mezi jednotlivými snímky videa, uvádí portál Techxplore.

Výsledkem je podle týmu systém, který dokáže zvýšit kvalitu obrazu videa až osmkrát – a to vše bez podivného zbarvení, nerovnoměrných linií nebo jiných známých problémů s obrázky a videem generovanými umělou inteligencí.

zdroj: Techxplore