Lažno pozitivni Bayes

Lažno pozitivni Bayes

Oddaja
14. 4. 2020 - 14.00

 

Pandemija COVID-19 je v polnem razmahu in z različnimi hitrostmi napreduje v praktično vseh kotičkih Zemlje. Vsak dan smo soočeni z novimi številkami novookuženih, ki pa predstavljajo le vrh ledene gore. Kako hitro se bolezen širi med populacijo in kako je razširjena, pa pravzaprav ne vemo natančno. To predstavlja veliko omejitev pri našem razumevanju širjenja bolezni in načrtovanju učinkovitejših ukrepov za njeno obvladovanje.

Številke novookuženih, s katerimi smo vsakodnevno soočeni, izvirajo iz testov, ki kažejo na prisotnost virusa oziroma natančneje njegovega genoma v odvzetem vzorcu nosnožrelnega brisa. Test temelji na specifični namnožitvi genetskega materiala, zapisanega na molekuli RNK virusa, s pomočjo obratne transkripcije in verižne reakcije s polimerazo, krajše RT-PCR. Metoda detekcije virusa SARS-CoV-2, ki je osnovana na reakciji RT-PCR, je bila razvita že zelo hitro po izbruhu virusa v Vuhanu in je v principu, če je vzorec pravilno odvzet, navadno izjemno občutljiva in natančna. Pove nam torej, ali se v odvzetem vzorcu nahaja virusna RNK, ki kaže na aktivno okužbo z virusom SARS-CoV-2.

Okužbo z virusom SARS-CoV-2 lahko zaznamo tudi preko imunskega odziva okuženega. Ob okužbi se namreč imunski sistem na virus med drugim odzove tudi s tvorbo protiteles, ki specifično prepoznajo molekularne komponente virusa. Takšna protitelesa se razvijejo dober teden dni po okužbi in ostanejo v krvnem obtoku vsaj še nekaj časa po preboleli bolezni. Takšna protitelesa navadno prebolele osebe zaščitijo pred vnovično okužbo. Študije na sorodnih koronavirusih kažejo, da bi takšna zaščita lahko trajala vsaj nekaj mesecev. Kitajska raziskava iz leta 2007 je na primeru prebolelih s SARS-CoV-1 pokazala na prisotnost protiteles tudi 2 leti po preživeli okužbi. Tukaj gre vseeno poudariti, da se virus s časom spreminja, kar pomeni, da takšna protitelesa lahko s časom vseeno izgubijo funkcijo prepoznave virusa, zato je težko predvideti, koliko časa bo imunost, posredovana z zaščitnimi protitelesi, pri prebolelem trajala.

Protitelesa pa ne zaščitijo zgolj posameznika, ki je okužbo prebolel, ampak tudi druge, saj že preboleli ne more več neposredno širiti virusa, ker naj ne bi bil več dovzeten za okužbo. Identifikacija prebolelih bi tako lahko predstavljala pomemben ukrep oziroma strategijo za ponoven zagon družbe. Prekuženi posamezniki in posameznice bi se lahko namreč vključili nazaj v običajno življenje. Hkrati bi podatki o številu prekuženih pokazali na pravo razsežnost pandemije v populaciji, saj trenutne številke kažejo bolj ali manj izkrivljeno sliko, ki je posledica različnih testnih strategij posameznih držav. Podatki o prekuženih so pomembni tudi z epidemiološkega vidika, saj lahko na njihovi podlagi izdelamo boljše modele in posledično boljše strategije nadzora širjenja virusa do razvoja učinkovitega cepiva.

Za implementacijo strategije tako imenovanih imunoloških prepustnic (ang. imunnity passports), za katero se denimo zavzema Združeno kraljestvo, je pomembno razviti zelo občutljive in natančne teste, ki bodo lahko zaznali prisotnost protiteles v krvi in potrdili preteklo okužbo z virusom SARS-CoV-2. Opišimo osnovni princip delovanja preprostega, hitrega serološkega testa. Osnova testa je označeni prosti protein oziroma del proteina iz virusne ovojnice - največkrat je to kar protein S, ki je odgovoren za prepoznavo receptorskega proteina ACE2 na gostiteljski celici. To omogoči vstop virusa v celico, kjer ta začne svoj reproduktivni cikel. 

Test je oblikovan kot trak z različnimi funkcionalnimi predeli, med katerimi kri gradientno potuje zaradi kapilarnega vleka. Po nanosu krvi preiskovanca na testno površino se protitelesa, ki specifično prepoznajo označene virusne delce, vežejo nanje. Raztopina krvi potuje naprej v detekcijski del testa, ki poskrbi za imobilizacijo vseh protiteles v krvi. V kolikor je med temi protitelesi tudi takšno, ki se je prej vezalo na označeni virusni delec, bomo čez nekaj minut lahko opazili barvno spremembo v detekcijskem delu testa. S takšnim testom navadno zaznamo dva tipa protiteles, ki sodelujeta pri začetnem imunskem odzivu, in sicer protitelesa tipa IgM in IgG.

Sliši se enostavno. Takšni testi dejansko v nekaterih komercialnih oblikah omogočajo zelo hitro in tudi poceni testiranje in so denimo podobni testom nosečnosti. Rezultat pa je uporabniku na voljo že 20 minut po tem, ko si je ta prebodel prst in daroval kapljico krvi. 

Proizvajalci takšnih hitrih testov na omejenem številu pozitivnih in negativnih testirancev validirajo test, tako da določijo število pozitivnih, lažno pozitivnih ter negativnih in lažno negativnih testov. Številni proizvajalci takih testov že trdijo, da njihovi testi dosegajo visoko specifičnost in občutljivost, ki skupaj določata celokupno natančnost oziroma zanesljivost testa. V idealnem primeru bi takšen test dosegel 100-odstotno občutljivost, ki določa uspešnost zaznave pozitivnih primerov, in 100-odstotno specifičnost, ki določa uspešnost zaznave negativnih primerov.

Britanska vlada je pred tedni naročila kar 3.5 milijona takšnih hitrih testov z namenom množičnega testiranja najprej zdravstvenih delavcev. Teste bi nato v lekarnah in na Amazonu ponudili še širši javnosti. Strokovna skupina je seveda teste pred množično uporabo poskušala validirati na večjem številu vzorcev in nekaj dni nazaj objavila, da se prav nobeden izmed kupljenih testov ni izkazal za dovolj natančnega. Kje se je morebiti zalomilo?

Postavimo se za trenutek v vlogo naključnega testiranca, ki želi izvedeti, ali je že prebolel COVID-19 ali ne. Odloči se opraviti vrhunski test proizvajalca Cellex, ki mu je urgentno odobritev podelila Uprava ZDA za hrano in zdravila ter se je na testih izkazal s 94-odstotno občutljivostjo in 96-odstotno specifičnostjo. Pičimo prst, spustimo kapljico krvi v tester in čez 20 min: “Super, rezultat je pozitiven, preboleli smo okužbo z virusom in zdaj smo zaščiteni.” Mar smo res?

Izkaže se, da je ključno pri interpretaciji takšnega individualnega testa upoštevati še pojavnost bolezni v populaciji, ki predstavlja kar odstotek vseh okuženih. Za tem se skriva Bayesov teorem, ki podaja pogojno verjetnost dveh odvisnih dogodkov. V našem primeru prvi dogodek določa verjetnost, da smo okuženi, ta pa je določena kar s pojavnostjo okužb v celotni populaciji in  verjetnostjo, da je test pravilno pozitiven, drugi dogodek pa določa verjetnost, da bo test, ki ga bomo izvedli, veljaven. Veljavnost testa določajo tako specifičnost kot občutljivost testa in verjetnost, da smo na test pozitvni ali negativni. Če je pojavnost okužb v  populaciji nizka, to predznanje o razširjenosti bolezni vpliva tudi na končno zanesljivost testa, saj obstaja večja možnost, da je bil v našem primeru, ko bolezen ni tako razširjena, rezultat našega testa v primeru pozitivnega rezultata lažno pozitiven. 

Navedimo primer: Denimo, da je okuženih 5 odstotkov vseh prebivalcev, kar je najbrž precej visoka ocena za trenutno pandemijo, potem končna zanesljivost našega pozitivnega rezultata, čeravno izvedena s super testom, ne bo okoli 95-odstotna, ampak zgolj 55-odstotna. Malo boljše kot metanje poštenega kovanca torej. Če bi se zanašali na takšen test in bi , denimo, z njim testirali vsi v dvomilijonski Sloveniji, bi več deset tisoč posameznikom in posameznicam podelili lažno imunost.

A kljub slabi napovedni moči na individualni ravni lahko takšen test v tej fazi epidemije pomembno doprinese k razumevanju razširjenosti okužb, saj se z večanjem števila testiranj zmanjša delež lažno pozitivnih in negativnih testov, kar nam lahko poda dokaj zanesljivo oceno o deležu okuženih v določeni testirani populaciji. Posredno pa nam bi takšno masovno testiranje povedalo več tudi o zanesljivosti testa na individualni ravni, saj bi tako bolje poznali pravo pojavnost bolezni.

V kolikor bi poskušali metodo imunoloških prepustnic izvesti sedaj s takšnimi hitrimi, a nezanesljivimi testi, kot si jih je sprva že zamislila britanska vlada, bi nazaj v običajno, nekarantensko življenje spustili velik odstotek ljudi, pri katerih bi bil test lažno pozitiven. To bi seveda lahko vodilo v nove nekontrolirane izbruhe novih okužb. A zagotovo tudi takšni nepopolni serološki hitri testi predstavljajo še neizkoriščeno in pomembno epidemiološko orodje, kasneje pa bodo ti testi lahko predstavljali tudi pomembno orodje sproščanja striktnih ukrepov karantene za ljudi, ki so bolezen že preboleli. 

Komentar je pripravil Uroš.

Aktualno-politične oznake: 

facebook twitter rss

 

Podprite kakovostne radijske vsebine tudi v koronski dobi, kliknite na

 

Prikaži Komentarje

Komentarji

"Denimo, da je okuženih 5 odstotkov vseh prebivalcev, kar je najbrž precej visoka ocena za trenutno pandemijo, potem končna zanesljivost našega pozitivnega rezultata, čeravno izvedena s super testom, ne bo okoli 95-odstotna, ampak zgolj 55-odstotna."
Moram reči, da ne razumem točno, kako pridemo do številke 55 odstotkov. Če ima avtor kaj prostega časa, ga lepo prosim za kratko dodatno obrazložitev tega izračuna. Hvala!

Seveda, hvala za opombo.
Najprej formalno Bayesov terorem.
P(A|B) = P(B|A) * P(A)/P(B)
Pri čemer sta A in B odvisna dogodka (in P(B) ni enak 0). Zvezo nekateri imenujejo tudi izrek o verjetnosti hipotez.

P(A|B) predstavlja pogojno verjetnost za dogodek A ob tem da se zgodi tudi dogodek B. V jeziku hipotez - verjetnost, da drži hipoteza A, če velja tudi B.

P(B|A) predstavlja pogojno verjetnost za dogodek B ob tem da se zgodi tudi A. V jeziku hipotez - verjetnost, da drži hipoteza B, če velja tudi A.

P(A) in P(B) predstavljata verjetnosti za dogodka A in B (neodvisno od drug drugega).
 

Prevedimo sedaj na naš problem (Cellex-ov test). Zanima nas, kolikšna je verjetnost, da smo pozitivni (dogodek A), če je naš test pozitiven (dogodek B). Zapišimo celotno formulo izreka.

P(+|test+) = P(test+|+) * P(+)/P(test+)
, pri čemer “+” pomeni oseba pozitivna, “test+” pa test pozitiven.

Opišimo in izračunajmo člene po vrsti:

P(test+|+): Kako verjetno je, da bo test pozitiven, če smo zares pozitivni?
To je odvisno od občutljivosti testa, ta določa kako dobro test zazna pozitivne primere. Za naš primer, torej P(test+|+) = 0.94 (94%).

P(+): Kolikšna je verjetnost, da smo pozitivni (naključni posameznik)?
Ta verjetnost je kar enaka razširjenosti bolezni v populaciji (prevalenca). P(+) = 0.05 (5%).

P(test+): Kolikšna je verjetnost, da je test pozitiven?

Pozitiven rezultat lahko dobimo v dveh primerih. Bodisi, da smo testirali pozitivnega in dobili pozitiven rezultat ali pa da smo testirali negativnega in spet dobili pozitiven rezultat (“lažno pozitiven”).
Prva verjetnost (pravilno pozitiven rezultat) je odvisna od občutljivosti testa in razširjenosti bolezeni, torej to kar smo že izračunali prej v števcu: P(test+|+)* P(+) = 0.94*0.05 = 0.047.
Drugo verjetnost (lažno negativen rezultat) pa je odvisna od specifičnosti testa ter deleža negativnih v populaciji (95%). Ker nas zanima delež primerov, ko test zataji in pokaže lažno pozitiven rezultat, je verjetnost lažno pozitivnega rezultata enaka 1 - specifičnost testa = 1 - 0.96 = 0.04. Tako dobimo drugo verejetnost, ki je enaka 0.04*0.95 = 0.037.

Izračunjamo sedaj končno verejtnost.

P(+|test+) = 0.94*0.05/(0.94*0.05+0.04*0.95) = 0.55 (55%)

Poleg obeh posnetkov, ki jih je priporočil/-a SVEKTOR, priporočam še obisk te spletne strani – spletni kalkulator zanesljivosti testa. Pa še nekaj osnov o specifičnosti in občutljivosti - tukaj.

Komentiraj

Plain text

  • No HTML tags allowed.
  • Spletni in e-mail naslovi bodo samodejno pretvorjeni v povezavo.
  • Samodejen prelom odstavkov in vrstic.

Z objavo komentarja potrjujete, da se strinjate s pravili komentiranja.

randomness