Od A do T
Lepo pozdravljene in pozdravljeni. V današnji oddaji Frequenza della scienza se bomo posvetili genomu. Natančneje – posvetili se bomo človeškemu genomu. Letos namreč obeležujemo dvajseto obletnico prve določitve zaporedja človeškega genoma. V oddaji bomo spoznali, kako so se znanstvenice in znanstveniki lotili enega izmed večjih projektov moderne biologije, kakšen je doprinos pridobljenih rezultatov in kako je ta dosežek vplival na nadaljnji razvoj genomike.
Genom predstavlja celotno dedno informacijo, zakodirano v obliki molekule DNK, ki je pri evkariontih shranjena v celičnem jedru. Molekula DNK je v osnovi polimerna molekula, sestavljena iz monomernih enot, ki jih predstavljajo štirje različni nukleotidi – gvanin, citozin, adenin in timin. Različne kombinacije teh štirih nukleotidov v molekuli DNK kodirajo življenjsko pomembne informacije. Te so shranjene predvsem v obliki genov, ki predstavljajo odseke genoma, ki vsebujejo navodilo za izgradnjo posameznih proteinov. Danes vemo, da je takšnih odsekov v celotnem genomu nekaj več kot 20.000 in da predstavljajo ti kodirajoči odseki le manjši del celotnega človeškega genoma, ki ga lahko opišemo kot zaporedje okoli treh milijard nukleotidnih baznih parov.
Omenjena spoznanja so eden izmed neposrednih rezultatov projekta, katerega ideja se je med ameriškimi genetiki in genetičarkami začela porajati že v osemdesetih letih prejšnjega stoletja – skušali so določititi zaporedje celotnega človeškega genoma. Kljub začetni nenaklonjenosti financerjev, se je leta 1990 pričel za tiste čase v očeh mnogih megalomanski projekt, poimenovan Human Genome Project oziroma slovenjeno – projekt Človeški genom.
Velikopoteznost projekta verjetno najbolje opiše začetna ocena glede financiranja, ki je znašala takratne 3 milijarde ameriških dolarjev, čas trajanja pa je bil ocenjen na 15 let. Projekt sta financirala ameriški Urad za energetiko ter ameriški Nacionalni inštitut za javno zdravje. Kljub temu da je bil projekt zasnovan v Združenih državah, pa so se kasneje projektu pridružile še številne raziskovalne skupine širom sveta, kar je vodilo v enega izmed največjih in najbolj mednarodno koordiniranih projektov v biologiji. Za retrospektivni pogled na projekt Človeški genom smo ob obletnici objave prvih rezultatov najprej prosili profesorja ter uglednega bioinformatika Paula Flicka, izvršnega direktorja Evropskega inštituta za bioinfomatiko v Hinxtonu v Združenem krajestvu, ki deluje v sklopu Evropskega laboratorija za molekularno biologijo.
Projekt, ki je skušal določiti nuklotidno zaporedje človeškega genoma, tako ni prinesel zgolj zaporedja samega, ampak je dodobra preobrazil in deloma revolucionariziral znanstveni pristop k naslavljanju velikih vprašanj v biologiji. Projekt Človeški genom je kljub pomislekom skeptikov, ki so dvomili predvsem v upravičenost vloženih sredstev, obljubljal veliko. Kakšna so bile pričakovanja od projekta, nam je pojasnil profesor Jernej Jakše z Biotehniške fakultete Univerze v Ljubljani.
Kot je v svoji uvodni izjavi nakazal tudi že profesor Flicek, se je v okviru raziskovanja genoma razvila prava tekma med javno financiranim projektom ter zasebnim projektom, za katerim je stalo podjetje Celera Genomics. Cilj podjetja je bil, da določijo zaporedje genoma z nekoliko drugačnim pristopom in precej manjšim finančnim vložkom. O rivalstvu med javno financiranim projektom in zasebnim podjetjem Celera ter posledicah te tekme je spregovoril tudi Cene Gostinčar, asistent s Katedre za molekularno genetiko in biologijo mikroorganizmov na Biotehniški fakulteti Univerze v Ljubljani.
Tekma za določitev nukleotidnega zaporedja genoma je na koncu – kljub, lahko bi rekli, delnemu pomanjkanju fair-play-ja – znanstvenike in znanstvenice le pripeljala do želenega cilja – določili so nukleotidno zaporedja genoma. A vseeno se vrnimo na začetek in pojasnimo, kako so se raziskovalci in raziskovalke sploh lotili tako velikega projekta.
V nadaljevanju oddaje bomo stopili po poti projekta od prvotnega določanja nukleotidnega zaporedja s takrat dostopnimi metodami sekvenciranja do sestavljanja sekvenciranih fragmentov v celotno zaporedje genoma z uporabo bioinformatskih orodij. Že z razumevanjem zmogljivosti za sekvenciranje genov konec 80. let prejšnjega stoletja lahko razumemo ambicioznost in obsežnost projekta Človeški genom. Proti koncu oddaje se bomo vprašali še o tem, kako lahko iz dolgega, na videz precej monotonega nukleotidnega zaporedja izluščimo pomembne informacije o delovanju žive celice ter organizmov.
DNK je, kot smo slišali, relativno enostavna molekula, zgrajena iz zgolj štirih različnih nukleotidov. A kljub enostavni zgradbi lahko ta molekula kodira informacijo o zgradbi in delovanju nepregledne pestrosti, ki jo predstavlja življenje. Evolucija je problem izdelave kompleksne informacije z enostavno strukturo’ rešila z vzpostavitvijo sistema, kjer je ključnega pomena zaporedje nukleotidov. Podobno kot so računalniški programi zgrajeni iz binarne kode, so genomi zgrajeni iz “štiriške” kode, pri kateri je ključnega pomena zaporedje, ki ga predstavlja niz nukleotidov. Pri kombiniranju štirih črk DNK-zaporedja v različno velike genome, dolge več milijonov ali nekaj milijard nukleotidov, dobimo iz zgolj štirih nukleotidov praktično neskončno možnih kombinacij.
Ob odkritju, da so na DNK zakodirane pomembne biološke informacije, so znanstveniki in znanstvenice potrebovali način, kako bi lahko prebrali zaporedje ter s tem pridobili vpogled v delovanje organizmov. Prelom na področju sekvenciranja se je zgodil sredi 70-ih let prejšnjega stoletja, ko so raziskovalci in raziskovalke iz laboratorija pod vodstvom angleškega biokemika Fredericka Sangerja razvili prvo metodo za določanja zaporedja DNK. Metodo nam predstavi profesor Jernej Jakše.
Dvoverižna vijačnica DNK je, kot pove že ime, zgrajena iz dveh vijačnic. Vijačnici sta med seboj komplementarni – to pomeni, da se nukleotidi obeh vijačnic med sabo parijo po določenem pravilu. Nukleotid gvanin se pari z nukleotidom citozinom, adenin s timinom. Če poznamo zaporedje ene vijačnice, poznamo tudi zaporedje druge in obratno; le poznati moramo opisano pravilo o parjenju nukleotidov. Ta lastnost komplementarnega parjenja je izredno pomembna pri številnih bioloških procesih, kot sta izražanje genov ter podvojevanje celične DNK, kar se zgodi med celično delitvijo.
Pri podvojevanju molekule DNK je izredno pomembno, da je novonastala molekula natančna kopija izvorne molekule. Celica to doseže tako, da pri podvojevanju za matrico uporablja kar posamezni vijačnici starševske molekule, na katero se nato zaporedoma dodajajo novi nukleotidi glede na prej opisani princip parjenja. Vsak na novo vgrajeni nukleotid se priključi po korakih, s čemer je v vsakem zaporednem koraku novonastala vijačnica daljša za en nukleotid.
Sangerjeva skupina je prišla do ideje, da lahko zaporedje nukleotidov določijo z zaustavljanjem izgradnje nove verige DNK. Če bi pri gradnji nove molekule naključno zaustavili izgradnjo, bi v reakciji, kjer je prisotnih veliko molekul DNK, uspeli dobiti množico takšnih, ki bi se po dolžini ločile za točno en nukleotid. Metodo nam podrobneje razloži profesor Jakše:
Sangerjeva metoda sekvenciranja je privedla do izjemnega napredka na področju genetike, saj je prvič omogočila relativno enostavno in zanesljivo določanje nukleotidnega zaporedja genov.
Do sredine 80. let prejšnjega stoletja so raziskovalci in raziskovalke uspeli določiti zaporedja številnih genov ter tudi krajših genomov, kot so virusni in bakterijski. S postopno avtomatizacijo določenih procesov ze branja genov so tudi ambicije počasi postajale večje in v znanstvenem svetu so se začele pojavljati tudi ideje o sekvenciranju daljših genomov, kakršne imajo glive, rastline in živali. Vendar je razlika v dolžini med virusnimi in evkariontskimi genomi lahko tudi večmilijonkratna. Problem sekvenciranja in analize daljših genomov nam predstavi doktor Cene Gostinčar, asistent s Katedre za molekularno genetiko in biologijo mikroorganizmov na Biotehniški fakulteti Univerze v Ljubljani.
Hitrost določanja zaporedja nukleotidov je bila konec osemdesetih omejena z metodo, ki so jo lahko uporabili za sekvenciranje. Sangerjeva metoda, čeprav hitrejša od alternativnih, lahko še vedno posekvencira zgolj približno 1000 nukleotidov v enem branju, kar pa predstavlja izredno majhen delež človeškega genoma. Več nam pove doktor Jernej Jakše:
Raziskovalci in raziskovalke so morali zato ubrati pristop, kjer so neizmerno obsežno nalogo sekvenciranja ogromnega genoma morali razdeliti na več majhnih, obvladljivih nalog. Pristop, ki so ga izbrali pri projektu Človeški genom, nam razloži doktor Cene Gostinčar.
Doktor Jakše nam v nadaljevanju konkretno razloži, s kakšnimi metodami so raziskovalci razdelili genom na fragmente. Te fragmente so nato posekvencirali in jih kartirali na mesta v človeškem genomu. Pri tem so se raziskovalci in raziskovalki posluževali metode restrikcijskega vzorca – to je metoda, pri kateri z natančnimi encimi režejo DNK na točno določenih mestih, na podlagi razrezane DNK pa lahko nato sklepajo o lokaciji posekvenciranega zaporedja na genomu:
Kot smo slišali, je torej pri sekvenciranju celotnih genomov še danes velika ovira dejstvo, da genoma ne moremo prebrati v enem kosu – od začetka do konca. Zaradi te omejitve so znanstveniki in znanstvenice morali iznajti način, kako kratka zaporedja povezati v celoto, pri čemer pa mora biti vsako zaporedje postavljeno na ustrezno mesto v celotni sekvenci.
Pristop, ki so ga izbrali in ki je v uporabi še danes, se imenuje zlaganje zaporedij, oziroma angleško – »sequence assembly« . Pri zlaganju se raziskovalci in raziskovalke zanašajo na to, da bodo zaporedja posekvenciranih kratkih fragmentov vsebovala dele, ki se bodo medsebojno prekrivali. Prav ti, prekrivajoči se deli nato služijo kot vezni členi, preko katerih združimo množico zaporedij v skupno zaporedje genoma.
Za nazoren prikaz zlaganja kratkih zaporedij DNK v skupno verigo si predstavljajmo, da želimo prebrati besedo »sekvenca«, ki pa je predolga, da bi jo prebrali v enem kosu. Zato si pomagamo tako, da jo razbijemo na krajše besede »sekv«, »ekve«, »venc« in »ca«. Zaradi prekrivanja določenih predelov lahko posamezne dele krajših besed povežemo na mestih, kjer so enaki. Isti princip še danes uporabljajo bioinformatiki pri sestavljanju genskih fragmentov, le da namesto besed uporabljajo črkopis nukleotidnega zaporedja.
Vmesni komad: Elmore James - Cry for me baby
V današnji oddaji Frequenza della scienza nadaljujemo s projektom Človeški genom, ki letos obeležuje svojo dvajseto obletnico. Pri projektu Človeški genom je sodelovalo dvajset inštitutov iz šestih držav. Kljub velikemu številu udeležencev in znatnemu financiranju je že sama velikost genoma predstavljala ogromno dela za tehnologijo, ki je bila takrat dostopna. Fragmente DNK je bilo treba razdeliti na manjše kose, jih namnožiti, posekvencirati ter nato urediti nazaj v celoto. Vsak od teh korakov je bil v devetdesetih letih prejšnjega stoletja še relativno počasen. Prav tako pa je bila količina informacij, ki so jo raziskovalci in raziskovalke morali analizirati, za tisti čas ogromna. Prvotne ocene glede trajanja in cene projekta so bile postavljene pri 15 letih in 3 milijardah ameriških dolarjev. Te ocene so se na koncu izkazale za dokaj točne:
Projekt Človeški genom ni bil zgolj uspeh molekularne biologije, temveč tudi bioinformatike, ki je danes, ko znamo naenkrat relativno hitro analizirati celotne genome, še dodatno pridobila na pomenu v bioloških raziskavah. Vloga bioinformatike pri analizi genoma je zlasti v urejanju več milijard kosov podatkov, ki jih je treba hitro urediti v razumljivo celoto. O vlogi bioinformatike v genomiki nam pove doktor Gostinčar:
Projekt Človeški genoma je zaradi potrebe po pospešitvi in poenostavitvi tako obsežne naloge hkrati privedel do izboljšanja cele množice tehnologij, s katerimi izvajamo sekvenciranje. Hitrejše in cenejše sekvenciranje je omogočilo, da danes analiziramo ne le posamezne gene, temveč celotne mreže genov, ki skupaj gradijo organizme. Kmalu po zaključku projekta Človeški genom se je sekvenciranje genomov tako pospešilo, da lahko 13 let trajajočo nalogo danes izvedemo v le nekaj tednih. Tako velik pospešek v analiziranju genomov se je zgodil prav zaradi napredka, storjenega med sekvenciranjem človeškega genoma. O tehnoloških izboljšavah, razvitih v okviru projekta, ter vplivu na raziskovanje bioloških sistemov nam pove doktor Gostinčar:
Danes lahko dokaj hitro in precej poceni določimo genska zaporedja. A zaporedje, četudi zloženo in urejeno v celotni zapis, ki gradi genom, nam samo po sebi ne pove kaj dosti. Brez dodatne analize obstaja le kot monoton niz štirih črk. Pomemben korak predstavlja osmišljanje teh črk, kar počnemo v procesu, ki ga s tujko imenujemo anotacija. V procesu anotacije določamo pomembnejše odseke na genomu, ki jim lahko pripišemo neko biološko pomembno vlogo. Med najočitnejše spadajo geni, ki kodirajo proteine. Pomembno pa je, da genome anotiramo tudi zaradi tega, da jih lahko sploh primerjamo med seboj, kar je denimo ključno za odkrivanje dednih bolezni. Pomen anotacije genoma nam pojasni tudi profesor Flicek.
Ob veliki količini podatkov, ki jih je ustvaril projekt Človeški genom, je postalo jasno, da je treba razviti avtomatska orodja za iskanje pomembnejših mest v človeškem genomu. Tudi tukaj je ključno vlogo odigrala bioinformatika. Znanje, ki so ga raziskovalci pridobili na manjših študijah, ki so se osredotočale na krajše fragmente DNK, kot so denimo geni, so bioinformatiki uporabili za iskanje sekvenc s podobnimi lastnostmi v velikih nizih podatkov, ki jih je zgeneriral projekt Človeški genom.
Pomemben korak v smeri avtomatskega anotiranja genoma je bil projekt ENSEMBL, ki se je začel odvijati proti koncu 90. in ga danes vodi ter usmerja prav naš gost, profesor Paul Flicek. Ta nam pojasni, kako se je projekt sploh začel in kakšni so njegovi osnovni cilji.
Projekt ENSEMBL je tako v duhu odprte znanosti delil novo znanje o človeškem genomu že v času, ko so ga odkrivali. To ni prispevalo samo k hitrejšemu razvoju bioloških znanosti, temveč je začrtalo tudi pomemben odmik od komercializacije genoma. Danes lahko tako prav vsi prosto dostopamo do zapisov človeškega ter tudi številnih drugih genomov; dostop je brezplačen z uporabo skrbno anotiranega genomskega atlasa, ki ga najdemo na spletnem strežniku projekta ENSEMBL. Profesor Flicek nam razloži, kako danes poteka povečini avtomatizirano pregledovanje genomov in njihova anotacija.
Kljub temu da celotno zaporedje človeškega genoma poznamo že kar nekaj časa, pa identifikacija biološko pomembnih zaporedij in določitev njihovih funkcij še vedno nista končani. Kot se je slikovito izrazil professor Flicek, bi si želeli, da bi nekoč razumeli čisto vsako črko v nukleotidnem zaporedju genoma, a smo od tega danes še precej oddaljeni. Čeravno o genomu še vedno ne vemo vsega, pa je znanje, ki smo ga pridobili od zaključka projekta Človeški genom leta 2003 – tudi s pomočjo projekta ENSEMBL –, pomagalo številnim znanstvenikom in znanstvenicam na področjih genomike, genetike in tudi klinično usmerjenih znanosti. Razlaga professor Flicek:
Projekt Človeški genom je privedel do močnega mednarodnega sodelovanja med raziskovalnimi inštituti, ki je bilo na področju bioloških znanosti pred tem še relativno redko, kar nam podrobneje razloži doktor Jakše:
Projekt je bil pomemben mejnik, logična končna točka napredka v razvoju genetike od odkritja zgradbe dednega materiala v 50. letih prejšnjega stoletja. A s poznavanjem zaporedja celotnega genoma so raziskovalci in raziskovalke vedno bolj spoznavali, da za razumevanje delovanja organizmov ne bo zadoščalo poznavanje zaporedja zgolj enega genoma. Za poznavanje povezav med genotipom in fenotipom, ki predstavlja vidne lastnosti nekega organizma, je ključno poznavanje razlik med genotipi osebkov ter njihovimi pripadajočimi fenotipi. Raziskave so se zato v letih po zaključku projekta – zlasti na račun pospešenega sekvenciranja – preusmerile iz raziskovanja posameznih na raziskovanje večih genomov osebkov iste vrste:
Zaključek projekta Človeški genom tako ni privedel do končnih odgovorov na vprašanja o človeški biologiji ali razumevanja celotnega zaporedja genoma, ampak do začetka mnogo novih raziskav. Obdobje zadnjih dvajsetih let je tako zaznamovala preusmeritev iz bioloških raziskav vedno bolj v hkratno analiziranj množice genomov ter njihovo medsebojno primerjanje. Ta zasuk je omogočil napredek v tehnologijah določanja nukleotidnega zaporedja in razvoj naprednejših algoritmov za njihovo analizo ter razvoj tako imenovanih »tehnologij sekvenciranja naslednjih generacij«, kar pa je že tema za novo oddajo.
Omenimo zgolj to, da lahko z novimi metodami določanja nukleotidnega zaporedja človeški genom danes preberemo v času, ki je primerljiv s trajanjem današnje oddaje, ki jo bomo sedaj tudi počasi sklenili. Orisali smo enega izmed večjih projektov moderne biologije – projekt Človeški genom. Pred dvajsetimi leti so raziskovalci in raziskovalke objavili prvi osnutek sestavljenega človeškega genoma. Rezultati projekta, ki v svojem golem bistvu predstavlja zgolj nize štirih črk, še danes niso v celoti razjasnjeni in zaposlujejo mnoge raziskovalke ter raziskovalce. Projekt je prispeval k neslutenem razvoju genomike, ki je z razcvetom tehnologije dobila dodatni veter v krila in tako danes predstavlja vse pomembnejšo disciplino znotraj polja biologije.
Raziskovalci in raziskovalke se zaradi pridobljenega znanja danes usmerjajo v vse bolj poglobljene študije genomov vseh živih organizmov. Prav nedavno so v sklopu projekta Vertebrate genomes project z objavo v reviji Nature napovedali pomemben korak k cilju določitve nukleotidnih zaporedij več kot 70.000 vretenčarjev. To je le eden izmed mnogih velikopoteznih projektov na področju moderne genomike, ki danes – predvsem zaradi novih metod sekvenciranja – doživlja pravi razcvet. Raziskovalci in raziskovalke želijo v sklopu različnih projektov opisati kar največ različnih vrst in se tako približati končnemu cilju, da bi raznolikost življenja opisali na nivoju genomov. Za konec profesor Flicek izpostavi še nekatere druge pomembne projekte na področju genomike:
Od začetka projekta Človeški genom smo prehodili dolgo pot. Biološka znanost je z razvojem genomike stopila v novo ero, ki jo zaznamuje predvsem velika množica genomskih podatkov, ki smo jih sposobni generirati v relativno kratkem času. Z razvojem vse boljših računskih metod za kvalitetno analizo zbranih podatkov se lahko praktično vsak dan dokopljemo do novih spoznanj o delovanju in funkciji še neznanih delov človeškega genoma. Genomika bo tako, kot je napovedal profesor Flicek, v prihodnosti odigrala ključno vlogo pri najpomembnejših problemih, s katerimi se bomo morali spoprijeti.
Oddajo sta pripravila Arne in Uroš.
Brala sva Lovro in Lovrenc.
Tehniciral je X.
Lektoriral je Luka.
Dodaj komentar
Komentiraj