Slabo uvajanje v statistične zmote in laži
Prevod zelo kratkega uvoda v statistiko, ki ga je za Oxford University Press spisal David J. Hand, je izšel pri Založbi Krtina v knjižni zbirki Kratka. Pripraviti zadovoljiv kratek uvod v tako obsežno disciplino, ki nam lahko omogoči videti stvari, ki so prostemu očesu med množico podatkov nevidne, na 137-ih straneh zagotovo ni lahka naloga, ni pa nemogoča. Profesor statistike z univerze Imperial College v Londonu se je v primerjavi z ostalimi pisci v isti seriji odrezal strašljivo slabo. Tako knjižica ni uporabna ne za začetnike brez predhodnega matematičnega znanja, ki naj bi jim bila prvotno namenjena, ne za tiste, ki so kdaj statistične ideje in metode že žvečili, in ne kot dober nabor referenc za nadaljnja branja, kar nekateri kratki uvodi iz iste zbirke so.
V prvem poglavju Hand predstavi nekaj osnovnih definicij statistike, med drugim široko in ohlapno, da je ta vse, kar je povezano z učenjem iz podatkov, od njihovega prvega načrtovanja ali zbiranja do zadnje predstavitve. Ne poda pa niti osnovnega razlikovanja med deskriptivno in inferenčno statistiko. Še najbolj vznemirljiv je - pričarati vznemirljivost statistike je namreč bil eden izmed profesorjevih ciljev -, ko opisuje filtre za elektronsko pošto, ki preprečujejo vdor opolzkih vsebin, kot jih sam poimenuje. V nadaljevanju nas pouči še o osnovnih statističnih orodjih, ki zadevajo osnovno povzemanje podatkov – o aritmetični sredini, modusu in mediani, vsebinah, ki so del osnovnošolske uporabne matematike.
V tretjem poglavju, pohvalno, poudari pomembnost zbiranja dobrih podatkov in nam predstavi tudi nekaj strategij za njihovo učinkovito zbiranje, od katerih je seveda odvisna veljavnost kateregakoli zaključka, ki ga povlečemo iz statističnih izračunov. Posebno podpoglavje nameni pogostim pomanjkljivostim pri vzorčenju v anketah. Skratka, tako kot surov krompir tudi surovi podatki potrebujejo čiščenje, zapiše Hand, le da statistiki niso čarovniki, in medtem ko ene smeti vržejo ven, druge vržejo noter. Verjetno tudi zato žal precej nespretno na široko opiše osnovne pojme verjetnosti, katere jezik nam kljub negotovosti in nepredvidljivosti dogodkov omogoča o njih vsaj nekaj izvedeti. V zadnjih poglavjih kratkega uvoda na hitro navrže še nekaj o tem, kako iz podatkov vleči sklepe in preverjati domneve, preleti pa tudi statistične metode in modele, ki bi morali ustrezno predstavljati temeljno resničnost problema.
Glede na vseprisotnost statističnih idej, ki so pogosto skrite v ozadju naših življenj, od medicine, politike, sociologije in tako dalje, bi človek pričakoval, da bo Hand po vseh ciljih, ki si jih je zadal, bralca pripeljal vsaj do osnovne statistične pismenosti. Da bo morebiti vsaj približno znal prepoznati preklete laži in to, kako stvari v resnici na drugi strani stojijo. Da bo znal razbrati, ali so recimo predstavljeni vsi relevantni rezultati ali le tisti, ki potrjujejo hipoteze naročnikov. Če recimo država veselo razglaša, kakšna je v posameznem mesecu povprečna plača, v to pa ne vključi ne kmetov, ne tistih, ki delajo na avtorske pogodbe, ne tistih, ki so samostojni podjetniki, ne tistih, ki so pri slednjih zaposleni, in še koga verjetno ne, bi statistično pismen bralec pomislil tudi, da bi bil zanimiv podatek to, kolikšen odstotek delavcev dobi manj in kolikšen več od tega zneska, in ga od Statističnega urada tudi zahteval. Razmerje osemdeset proti dvajset ne bi presenetilo.
Pomanjkanje vizualnega materiala, s katerim se o zaključkih raziskav pogosto poroča, je resen primanjkljaj za razumevanje te knjige. Predvsem v zadnjih poglavjih, ki od začetne lahkotnosti vstopanja v temo preidejo v resno statistično teorijo. Prav tako prazen je prikaz vpliva računalnika na disciplino. Ne ponuja namreč niti grobega preleta statističnih programov ali namigov za odlične spletne strani, ki so namenjene učenju statistike, obogatene pa so z video materialom in celo kvizi, s pomočjo katerih lahko preverjate svoje znanje.
Hand je vse preveč prostora porabil za navdušenje, da je profil statistika kljub odličnim računalniškim programom vedno bolj iskan, in premalo za to, da bi zares prikazal moč in pomembnost same vede. Človek se vpraša, zakaj je prevod tega dela glede na ogromno število statističnih učbenikov za matematike, ekonomiste, družboslovce in mnoge druge, ki jih že premoremo, sploh potreben? Gre namreč za uvod za telebane, ki, četudi ta uvod preberejo, žal statistični telebani tudi ostanejo.
Dodaj komentar
Komentiraj