
Umělé inteligence mění svět v mnoha ohledech. Podle nového výzkumu začínají mít už vliv i na podobu jazyka, kterým lidé mezi sebou komunikují. První náznaky se našly ve vědeckých studiích.
Před třemi lety internet explodoval novým druhem obsahu. Umělé inteligence dosáhly takových kvalit, že je vědci začali využívat pro psaní odborných studií. Nikdo ale neví, jak moc – řada vědců to nepřizná, protože jim to může připadat jako přiznání neschopnosti nebo slabosti.
V akademických článcích, které mnohdy slouží jako podklady pro politická rozhodnutí, je tak stále složitější rozlišit čistě lidský text od obsahu, který byl buď upraven, nebo zcela vygenerován pomocí velkých jazykových modelů, jimž se zjednodušeně říká umělé inteligence (AI).
Americko-německý tým se teď pokusil zjistit, jak rozšířený je vlastně obsah vytvořený „nelidskými aktéry“, tedy stroji. Vědci dokázali analyzovat obrovské množství materiálů, celkem 15 milionů shrnutí vědeckých studií (tedy takzvaných abstraktů), které se týkaly biomedicínských oborů a jsou uložené v databázi PubMed. Zajímalo je, jestli se články napsané umělou inteligencí nějak lišily od těch vytvořených lidmi.
Obliba frází a floskulí
Analýza odhalila, že za poslední tři roky začalo ve vědeckých textech nápadně přibývat některých stylistických slovních spojení. Z těchto údajů vyplývá, že nejméně 13,5 procenta článků publikovaných v roce 2024 bylo napsáno s nějakým přispěním AI. A podíl těchto článků stoupá.
Umělé inteligence totiž více či méně zdařile napodobují lidské psaní a stejně jako lidé si oblíbily některé fráze, klišé nebo i rovnou floskule. Jenže zatímco každý člověk má své vlastní, což se otiskne maximálně do několika studií, každý model AI se může podílet na statisících článků a má proto mnohem větší dopad na celkovou kulturu „vědeckého jazyka“ než jakýkoliv člověk.
Nová studie prokázala, že poté, co společnost OpenAI dala veřejnosti do rukou svůj model ChatGPT, začalo se v odborných článcích objevovat stále více květnatých výrazů, jež dříve nebyly ve vědě tak časté. Nejčastěji jde o hodnocení, jako je třeba „klíčový“, „signifikantní“ nebo „potenciální“. Objevuje se ale i více sloves typu „potýkat se“, což jsou vlastně přenesená metaforická vyjádření, jež byla dříve častěji spojená s popularizací vědy než přímo se samotnými vědeckými studiemi, jež měly „chladnější“ formu.
Oč více těchto zabarvených výrazů, o to méně bylo ve studiích těch informativních. Zjednodušeně: ve studiích psaných AI přibývá sloves a přídavných jmen, ale ubývá podstatných jmen.
Posilující vliv
Autoři srovnali vliv AI na změnu vědeckého jazyka s dopadem covidové pandemie na řeč vědeckých výzkumů. Přestože se během pandemie právě na covid a virus SARS-CoV-2, jenž ho způsobuje, stočila pozornost celého světa a ve studiích se objevily do té doby neexistující termíny (jako právě názvy nemoci a viru), byl dopad na jazyk těchto výzkumů ve skutečnosti menší než současná změna způsobená AI.
„Tento efekt bude v budoucnu pravděpodobně ještě výraznější, protože lze analyzovat více publikačních cyklů a velké jazykové modely se budou pravděpodobně stále více používat,“ konstatují vědci. Může to přinést samozřejmě i další komplikace, protože AI se učí z textů, které jsou nyní samotnými AI už napsané, takže se bude ten dopad ještě více posilovat a bude zřejmě pronikat i mimo akademický svět.
