Na konci února zveřejnili vědci zatím největší model umělé inteligence (AI) zaměřený na biologii. Podle odborného časopisu Nature je model Evo 2 vyvinutý na Stanfordově univerzitě přelomový: dokáže totiž od základu napsat celé genetické kódy chromozomů i menších genomů. A to není zdaleka všechno: objasnit by mohl například příčiny výskytu rakoviny.

AI model pojmenovaný Evo 2 je vědcům plně k dispozici zdarma na tomto webovém rozhraní, ale navíc si ho mohou kompletně stáhnout, aby si ho mohli upravit pro své potřeby. Spolupracovala na něm i technologická společnost Nvidia, která poskytla čipy potřebné k výcviku tak komplexní umělé inteligence, a vědci z ústavu Arc Institute.

Vědci nejprve museli model natrénovat, „dát mu vzdělání v oboru“ tak, aby byl schopný dělat to, co má. Tento trénink probíhal tak, že ho naučili genomy (tedy kompletní genetické informace) 128 tisíc druhů – od těch nejmenších jednobuněčných bakterií až po člověka. Ovládl tak informace o tom, z čeho se skládá život na Zemi.

Díky tomu už umí napsat celé chromozomy, a dokonce i malé genomy – tedy menší organismy. Dokáže ale také pochopit existující DNA, včetně obtížně interpretovatelných „nekódujících“ variant genů, které jsou často spojeny s nemocemi.

„Těšíme se na to, jak vědci a inženýři vytvoří tento obchod s aplikacemi pro biologii,“ řekl Patrick Hsu, bioinženýr z Arc Institute a Kalifornské univerzity v Berkeley, na tiskové konferenci, kde Evo 2 představil. Současně je model popsaný v odborném časopise, ale vědci se zatím neodvažují odhadovat, co všechno by mohla tato AI jejich oboru přinést. „Budeme muset zjistit, jak obstojí v nezávislých srovnávacích testech,“ konstatoval počítačový genomik Anshul Kundaje ze Stanfordovy univerzity v Palo Alto.

Jazyk genů

Popsat všechny možné kombinace genetického kódu je pro člověka nemožné – je jich zkrátka příliš mnoho. Miliardy možností jsou nad schopnosti lidského mozku, ale ne těch silikonových, tedy AI. Modelů, které se pokoušejí předvídat struktury bílkovin a na tom základě navrhovat nové, je více. Známý je ESM3 vyvinutý bývalými zaměstnanci společnosti Meta. Nový Evo 2 je ale mnohem komplexnější a obsáhlejší.

Na rozdíl od starších modelů byl totiž Evo 2 vycvičen na mnohem komplexnějších datech. Je bohatější zejména o takzvanou nekódující DNA. To jsou části, které řídí, jak se geny aktivují.

Evoluce zakódovala biologickou informaci do DNA a podobné nukleové kyseliny RNA a vytvořila vzory, které systém Evo 2 dokáže rozpoznat a využít. „Stejně jako svět zanechal svůj otisk v jazyce internetu, který se používá k trénování velkých jazykových modelů, evoluce zanechala svůj otisk v biologických sekvencích,“ říká spoluautor práce Brian Hie ze Stanfordovy univerzity. „Tyto vzorce, zdokonalované po miliony let, obsahují signály o tom, jak molekuly fungují a vzájemně se ovlivňují.“

Naděje i obavy

Model podle autorů vykazuje dostatečnou univerzálnost pro identifikaci genetických změn, které mají významný vliv na lidský život. Například při testech s variantami genu BRCA1, který souvisí s rakovinou prsu, dosáhl model Evo 2 více než devadesátiprocentní přesnosti při předpovídání, které mutace jsou benigní a které potenciálně patogenní. To by mohlo ušetřit nespočet hodin a dolarů na výzkum potřebný k provádění pokusů na buňkách nebo zvířatech, protože by se tak daly najít genetické příčiny lidských onemocnění a dal by se urychlit vývoj nových léků.

Kromě genetické analýzy by Evo 2 mohl být užitečný i pro konstrukci nových biologických nástrojů nebo léčebných postupů. Například „pokud máte genovou terapii, kterou chcete zapnout pouze v neuronech, abyste se vyhnuli vedlejším účinkům, nebo pouze v jaterních buňkách, mohli byste navrhnout genetický prvek, který je přístupný pouze v těchto konkrétních buňkách,“ uvedli autoři. „Tato přesná kontrola by mohla pomoci vyvinout cílenější léčbu s menšími vedlejšími účinky.“

A co rizika? Nabízí se třeba možnost analyzovat jedy nebo patogeny, aby tak kdokoliv s přístupem k internetu vyrobil jejich vylepšenou variantu. Právě proto vědci s ohledem na tato potenciální etická a bezpečnostní rizika vyloučili ze základního souboru dat modelu Evo 2 patogeny, které infikují člověka a další složité organismy, a současně zajistili, aby model nevracel produktivní odpovědi na dotazy týkající se těchto patogenů.

Podíl.
Exit mobile version