16. 2. 2023 – 8.05

Ustvarjanje novih proteinov z umetno inteligenco

Audio file

Raziskovalna skupina iz Združenih držav Amerike je ustvarila jezikovni model, ki na podlagi ključnih besed generira nova aminokislinska zaporedja proteinov z lastnostmi, ki ustrezajo ključnim besedam. Za skupino takó generiranih proteinov so tudi eksperimentalno pokazali, da so dejansko imeli želene lastnosti. Izsledke svojega raziskovalnega dela so objavili v reviji Nature Biotechnology.

Proteini so sestavljeni iz aminokislin, ki so med seboj povezane v linearno verigo. Vrstni red aminokislin določa vse lastnosti proteina. Aminokislinsko zaporedje proteina pogosto zapišemo kot dolgo besedo, v kateri vsaka črka predstavlja eno aminokislino.

Audio file
19. 2. 2023 – 12.00
»Kontekst je vse« – ChatGPT, najverjetneje

Glavni gradnik danes predstavljenega jezikovnega modela je globoka nevronska mreža, imenovana transformer. Transformer preoblikuje eno zaporedje v drugo, pri čemer upošteva povezave med zaporednimi enotami nekega zaporedja, denimo med črkami v besedi ali med besedami v stavku. V primeru danes predstavljenega modela je transformer na podlagi nekih ključnih besed generiral aminokislinsko zaporedje proteina.

Ameriška raziskovalna skupina je svoj jezikovni model trenirala na podlagi podatkov o 280 milijonih proteinov iz javnih baz. Ključen podatek je bilo aminokislinsko zaporedje proteina. Model pa je imel na voljo še nekatere druge podatke, denimo iz katerega organizma izvira protein, kateri proteinski družini pripada in v katerih procesih je udeležen. Model je nato sam ugotovil pravila, za katero aminokislino je najbolj verjetno, da se nahaja na določenem mestu v aminokislinskem zaporedju. Analogno kot jezikovni modeli za procesiranje naravnega jezika sami izluščijo slovnična in semantična pravila jezika.

Za preizkus modela je raziskovalna skupina generirala milijon aminokislinskih zaporedij. Kot ključno besedo so določili, da naj generirana zaporedja pripadajo družini lizocimov. To so encimi, ki jih živali proizvajajo v denimo solzah in slini za zaščito pred mikroorganizmi, saj cepijo bakterijsko celično steno. Iz milijona generiranih zaporedij so nato izbrali sto zaporedij, ki so se odločno razlikovala od aminokisinskih zaporedij naravnih lizocimov. Na podlagi teh izbranih zaporedij so raziskovalke in raziskovalci v laboratoriju z brezceličnim sistemom sintetizirali proteine in pomerili, kako uspešni so pri cepljenju bakterijske stene. Ugotovili so, da so bili umetno generirani proteini pri tem enako uspešni kot sto naravnih lizocimov, ki so jih uporabili za kontrolo.

Audio file
15. 8. 2021 – 15.00
Izjemen dosežek umetne inteligence pri reševanju največjh vprašanj v biologiji

Pomembno je poudariti, da model ameriških raziskovalk in raziskovalcev ni imel nikakršnih informacij o strukturi ali biofizikalnih lastnostih proteinov. Pravzaprav je bil bolj podoben jezikovnim modelom, kot je denimo ChatGPT, kot pa AlphaFoldu, algoritmu, ki napoveduje tridimenzionalne strukture aminokislinskih zaporedij na podlagi fizikalnih in bioloških lastnostih proteinov. Le na podlagi podatkov o aminokislinskem zaporedju je model uspel izluščiti pravila, kje se mora nahajati določena aminokislina, da dobimo funkcionalen protein z želenimi lastnostmi.

Znanstveni britOFF je z naravnimi nevronskimi mrežami zgenerirala Angelika.

 

 

Vir slike: https://commons.wikimedia.org/wiki/File:Sequencia_VAPB.png

Prazen radio ne stoji pokonci! Podpri RŠ in omogoči produkcijo alternativnih, kritičnih in neodvisnih vsebin.

Dodaj komentar

Komentiraj

Z objavo komentarja potrjujete, da se strinjate s pravili komentiranja.