The New York Times žaluje Microsoft a OpenAI za porušení autorských práv

Služba ChatGPT se dostala do povědomí uživatelů internetu po celém světě. Miliony lidí tento nástroj neustále používají, ale zároveň rostou právní obavy ohledně materiálů používaných k trénování umělé inteligence.

Deník The New York Times se nepohodl se společností Microsoft
Generativní umělá inteligence byla bezpochyby hitem roku 2023. Nástroje jako ChatGPT od OpenAI a Bard od Googlu si získaly značnou popularitu a mnoho lidí je začíná používat při své každodenní práci. Zvláště když ChatGPT v podobě Copilota od Microsoftu přichází nejen do Office, ale i do Windows. Jak však název napovídá, generativní umělá inteligence využívá k tvorbě svého obsahu obrovské množství dat, na kterých se učí. Ne všem tvůrcům se použití jejich textů k trénování algoritmů líbí, a tak již několik měsíců probíhají intenzivní zákulisní jednání.

Microsoft se dohodl s vydavateli, jako jsou například Axel Springer a Associated Press, kteří mu mimo jiné umožňují používat jejich textové databáze. Podobných jednání se účastnil i deník New York Times, ale obě strany se nedohodly. V důsledku toho podal vydavatel New York Times na Microsoft a OpenAI žalobu k soudu, v níž tvrdí, že došlo k porušení zásad spravedlivé hospodářské soutěže. Podle zástupců novin se umělá inteligence nejprve učila z tisíců textů publikovaných v Timesech a nyní sama vytváří konkurenční texty, v nichž cítí vliv stylu novinářů listu, píše samotný list NYtimes.

Podle žaloby mají společnosti Microsoft a OpenAI na tomto obratu vydělat spoustu peněz, zatímco New York Times se cítí ohroženy ztrátou „miliard dolarů“ potenciálních zisků v budoucnu a nekalou konkurencí ze strany služeb, jako je Copilot. Deník chce, aby LLM modely přestaly používat jeho výukové materiály. Podobný názor zastávají i BBC, CNN a Reuters, které zablokovaly tzv. crawlery prohledávající web a hledající texty, které Copilot/Chat GPT používají k tvorbě svých článků. To bude mimochodem stále častější jev, protože bezplatný Copilot umožňuje nejen tvorbu delších článků, ale dokonce umožňuje zvolit styl, jakým mají být napsány. Pokud však mají mít aktuální znalosti, musí je umět čerpat z webu. Bez toho bude i sebelepší model k ničemu.

Otázka využívání textů publikovaných v různých médiích se bude pravděpodobně objevovat stále častěji a společnosti pracující na technologiích generativní umělé inteligence budou muset vyvinout model pro získávání dat k trénování svých modelů.

Zdroj: NYtimes