Nový český software by mohl přinést automatický překlad hodný lidského projevu

Systém automatického překladu s názvem Cubbitt, který vyvinuli jazykoví odborníci z Univerzity Karlovy, překonává světovou konkurenci, informuje web Expats.

Nejznámější je pro většinu lidí překladač Google, i když mezi další možnosti patří stále populárnější aplikace Deepl a překladač Microsoft Bing.

Žádný překladač však není dokonalý. Nejoblíbenější aplikace mají tendenci se lišit v přesnosti překladu v závislosti na zjištěných jazycích. Například je známo, že Překladač Google funguje lépe pro nejrozšířenější světové jazyky, jako je španělština a angličtina, než pro méně rozšířené jazyky, jako je čeština.

V této souvislosti může být řešením lokálně vyvinutá aplikace. Odborníci z pražské Univerzity Karlovy vyvinuli překladatelský software s názvem CUBBITT, který nyní překonává světovou konkurenci v každoroční soutěži Workshop on Machine Translation. V testu se hodnotí kvalita překladu z různých jazyků, včetně češtiny do angličtiny a naopak.

„Překladač Google dlouho vítězil. V roce 2018 však v soutěži zvítězil náš veřejně dostupný systém CUBBITT. Porazili jsme všechny ostatní testované překladače a k mému překvapení i profesionální překladatelskou agenturu,“ řekl v rozhovoru pro ČT24 Martin Popel, vývojář systému CUBBITT. „Z hlediska přesnosti překladu jsme si vedli výrazně lépe než překladatelská agentura, i když v plynulosti jsme byli horší.“

CUBBITT byl vyvinut pomocí neuronových sítí, kde hustá síť datových spojení podporuje učení počítače v procesu napodobujícím činnost lidského mozku. Tento proces, označovaný jako „hluboké učení“, stojí za všemi nejvýkonnějšími systémy automatického překladu. CUBBITT je skutečně založen na síti Transformer, kterou veřejně zpřístupnila společnost Google.

Do překladatelského softwaru se pak prostřednictvím výkonných počítačů načítá obrovské množství dat; čím více dat, tím lépe. V tomto kontextu je úspěch systému CUBBITT o to mimořádnější, že tým Univerzity Karlovy nemá k dispozici obrovské technologické zdroje, kterými disponují velké mezinárodní technologické korporace, jako jsou Google a Microsoft.

Zdroj: expats.cz, ČT24