ChatGPT překonal studenty medicíny v otázkách klinické péče
Nová studie poukazuje na schopnosti umělé inteligence analyzovat lékařské texty a nabízet diagnózy, což by mohlo vést k přehodnocení způsobu výuky medicíny.
ChatGPT, nejznámější ze systémů umělé inteligence, které v posledních měsících zaujaly veřejnost, překonal studenty prvního a druhého ročníku medicíny v odpovědích na náročné otázky ve zkoušce z klinické péče, píše portál ITWorld. Ukázala to nová studie provedená skupinou stanfordských vědců, jejíž výsledky naznačují potřebu nového přístupu k výuce budoucích lékařů.
Umělá inteligence již byla povolána k řešení zkoušky USMLE (United States Medical Science Examination) strukturované na otázky s výběrem odpovědí, která je povinná pro lékaře, kteří chtějí vykonávat praxi. Nyní ji však výzkumníci ze Stanfordu chtěli podrobit složitějšímu testu zahrnujícímu otázky, které od studentů vyžadují schopnost klinického uvažování, například při stanovení možných diagnóz, a složité, otevřené odpovědi.
V článku zveřejněném v časopise JAMA Internal Medicine vědci tvrdí, že model ChatGPT dosáhl v tomto typu testu o více než čtyři body vyššího skóre než studenti. „Byli jsme velmi překvapeni, jak dobře si ChatGPT vedl v tomto typu otevřených otázek lékařského uvažování, když překonal výsledky lidských účastníků testů,“ říká Eric Strong, profesor na Stanford School of Medicine a autor studie.
„Výuku a testování lékařského uvažování mohou nové nástroje umělé inteligence zcela narušit,“ dodává Alicia DiGiammarino, vedoucí výuky druhého ročníku lékařské praxe na School of Medicine. „ChatGPT a další podobné programy mění způsob výuky a lékařské praxe.“
Výzkumníci použili nejnovější verzi programu ChatGPT, nazvanou GPT-4 a vydanou loni v březnu. Různé případy, k nimž se měli studenti a umělá inteligence vyjádřit, představovaly textové popisy v rozsahu od několika set do tisíce slov s mnoha cizími detaily, jako jsou chronická onemocnění a nesouvisející léky, stejně jako v reálných záznamech pacientů. Umělá inteligence proto musela nejprve rozpoznat nadbytečné informace, aby je mohla vyloučit pro formulaci své analýzy.
Vědci mimo jiné zaznamenali výrazné zlepšení u verze GPT-4 ve srovnání s verzí 3.5. Zatímco předchozí verze vykazovala srovnatelné výsledky s těmi, kterých dosáhli studenti, nová verze je mnohem přesnější. Výsledky byly natolik lichotivé, že musel být změněn i samotný systém výuky medicíny. Zejména klinická péče je do značné míry závislá na shromažďování informací ze zdrojů, což je praxe, v níž může být umělá inteligence lékařům velkou oporou.
„Nechceme, aby lékaři byli ve škole natolik závislí na umělé inteligenci, že se nedokážou naučit uvažovat o případech sami,“ říká DiGiammarino. „Ale spíše se obávám světa, ve kterém lékaři nebudou vyškoleni k efektivnímu využívání umělé inteligence.“
„K tomu, aby umělá inteligence lékaře zcela převzala, vede ještě dlouhá cesta,“ dodává Strong. „Ale určitě ji budeme muset brzy integrovat do každodenní medicíny.“
Zdroj: JAMA Internal Medicine, ITWorld