Aplikace společnosti Adobe využívá umělou inteligenci k tomu, aby byla rozmazaná videa ostrá a jasná
Tým inženýrů zabývajících se videem a umělou inteligencí ve společnosti Adobe Research vyvinul aplikaci s umělou inteligencí nazvanou VideoGigaGAN, která dokáže přijmout rozmazané video a vylepšit ho tak, aby bylo mnohem plastičtější. O aplikacích umělé inteligence se v poslední době hodně mluví, především díky vydání jazykových modelů, jako je ChatGPT, které mohou spotřebitelé používat k vytváření nejrůznějších výstupů. Výzkum AI však probíhá i v dalších oblastech, například při vytváření umělých obrázků a videí.
V tomto novém úsilí vytvořil tým společnosti Adobe aplikaci, která dokáže přijmout rozmazaný vzorek videa a po zpracování vrátit stejný vzorek s výrazně zvýšenou ostrostí a jasností – známý také jako upscaling. Nazývá se VideoGigaGAN – název pochází z dříve předvedené aplikace GigaGAN, která generovala nové fotografie nebo vylepšovala staré. GAN je zkratka pro generativní adverzní síť.
Adobe drops VideoGigaGAN
— Linus ●ᴗ● Ekenstam (@LinusEkenstam) April 22, 2024
Upsample video by 8x using this new video upscaling method with insane results and details.
7 stunning examples below ? pic.twitter.com/9K617GbTZb
Jak už název napovídá, tým použil generativní adverzní síť, aby systém naučil, jak vypadá ostré a jasné video (například jednotlivé chloupky v obočí, a ne rozmazaná hmota), a poté přidal „modul propagace řízené tokem“, který udržuje konzistenci mezi jednotlivými snímky videa, uvádí portál Techxplore.
Výsledkem je podle týmu systém, který dokáže zvýšit kvalitu obrazu videa až osmkrát – a to vše bez podivného zbarvení, nerovnoměrných linií nebo jiných známých problémů s obrázky a videem generovanými umělou inteligencí.
zdroj: Techxplore