31. 5. 2023 – 8.05

Napovedovanje funkcije encimov s strojnim učenjem

Audio file

Ameriška raziskovalna skupina je v raziskovalnem članku, objavljenem v reviji Science, predstavila algoritem strojnega učenja, ki bolj točno in zanesljivo napoveduje, katere kemijske reakcije katalizirajo encimi.

Encimi so proteini, ki katalizirajo kemijske reakcije. Tako kot za druge proteine tudi za encime velja, da njihovo funkcijo v glavnem določa njihova 3D-struktura. 3D-strukturo pa določa aminokislinsko zaporedje, torej vrstni red, v katerem se v linearni verigi pojavljajo aminokisline, osnovni gradniki proteinov.

Napovedovanje funkcije proteinov iz aminokislinskega zaporedja je kljub desetletjem raziskav na tem področju še vedno eden večjih izzivov v biologiji. Eksperimentalna karakterizacija funkcije določenega proteina je pogosto dolgotrajna in tudi draga. Eksperimentalno okarakterizirani proteini zato predstavljajo le manjši delež aminokislinskih zaporedij, ki so shranjena v podatkovnih bazah. Pri napovedovanju funkcije določenega aminokislinskega zaporedja si zato pomagamo tudi z računalniškimi modeli. Tradicionalno ti modeli napovedujejo funkcijo na podlagi ene ali več lastnosti proteina, denimo podobnosti v aminokislinskem zaporedju, evolucijskih odnosov s proteini z znano funkcijo ter fizikalno-kemijskih lastnosti. Za skupine proteinov, tudi encimov, ki jih razmeroma dobro poznamo, ti modeli po navadi dajejo dobre napovedi, pri manj proučevanih skupinah proteinov pa pogosto niso zanesljivi.

Ameriška raziskovalna skupina je razvila nov algoritem strojnega učenja za napovedovanje številk EC encimov. Sistem številk EC je najbolj razširjen sistem klasifikacije encimov. Encimi, ki katalizirajo enako kemijsko reakcijo, imajo enako številko EC. Torej algoritem z napovedovanjem številk EC pravzaprav napoveduje funkcijo encimov.

Ameriške raziskovalke in raziskovalci so svoj algoritem učili s podatki o aminokislinskih zaporedjih, številkah EC encimov in še dodatnih podatkih o encimih iz podatkovne baze Uniprot, če so bili ti na voljo. Pri učenju so uporabili metodo kontrastnega učenja. Bistvo te metode je, da vsakemu vzorcu, torej encimu iz podatkovne baze, pripiše en pozitivni in en negativni primer. Pozitivni in negativni primeri algoritmu pomagajo, da v podatkih odkrije vzorce, ki so skupni encimom z enakimi številkami EC, ter tiste vzorce v podatkih, ki se razlikujejo pri encimih z različnimi številkami EC. Cilj treninga je bil, da algoritem napove številke EC encimov le na podlagi njihovega aminokislinskega zaporedja, brez dodatnih informacij.

Raziskovalna skupina je novi algoritem primerjala z drugimi trenutno najboljšimi algoritmi za napovedovanje funkcije encimov. Vsem tem algoritmom so dali napovedati številke EC za encime, ki niso bili uporabljeni pri treningu nobenega od njih. Njihov novi algoritem je podal najbolj pravilne napovedi, še posebej dobro se je odrezal pri encimih iz manj proučevanih skupin, za katere je v podatkovnih bazah na voljo le bore malo podatkov. Drugi algoritmi so se pri takih primerih odrezali precej slabše.

Ameriške raziskovalke in raziskovalci verjamejo, da je njihov algoritem zaradi boljših napovedi lahko uporaben na področjih, kjer je napovedovanje funkcije encimov lahko v veliko pomoč, denimo v metabolnem inženirstvu. Poleg tega predstavlja njihov algoritem splošno ogrodje, ki ga je z nekaj spremembami mogoče uporabiti tudi za druge probleme, katerih cilj je napovedovati določene lastnosti.

Znanstveni BritOFF je brez uporabe algoritmov spisala Angelika.

 

Vir slike: https://commons.wikimedia.org/w/index.php?search=Enzymes&title=Special%…

Aktualno-politične oznake

Prazen radio ne stoji pokonci! Podpri RŠ in omogoči produkcijo alternativnih, kritičnih in neodvisnih vsebin.

Dodaj komentar

Komentiraj

Z objavo komentarja potrjujete, da se strinjate s pravili komentiranja.