17. 5. 2024 – 7.05

Skriti citati

Audio file

Ko neko odkritje ali tehnika postaneta splošno znana, se pri citiranju zgodi tako imenovan pojav »izbrisa z vključitvijo«. Ta pojav povzroča skrite citate, ki predstavljajo reference na odkritje brez direktnega citiranja ustreznega dela. Bolj ko se koncept ali odkritje uporabljata v znanstveni skupnosti, večja je verjetnost, da njune ugotovitve v preostalih objavah ne bodo neposredno citirane. Doslej so skrite citate prepoznavali ročno, znanstvena skupina iz Bostona pa se je tega lotila, kakopak, s pomočjo strojnega učenja. Študijo je objavila v reviji PNAS Nexus.

Znanstvenice in znanstveniki so za učenje modela strojnega učenja podatke zbrali iz baze podatkov unarXive. Slednja obsega več kot milijon publikacij in 29,2 milijonov citatov s konteksti njihove umeščenosti. Najprej so analizirali vezni tekst okoli citatov in te razvrstili v pet glavnih kategorij, ki obsegajo fiziko visokih energij, fiziko kondenzirane snovi, kvantno fiziko, astrofiziko ter ostalo. Določene besedne zveze so namreč povezane z določenimi članki znotraj tem. Na primer »AdS/CFT«, kratica za teorijo, ki povezuje kvantno teorijo polja in splošno relativnost, se uvršča v kategorijo fizike visokih energij, izvira pa iz članka iz leta 1999. Natančnost klasifikacije modela strojnega učenja so na naključnem ožjem naboru podatkov ročno potrdili raziskovalci in raziskovalke z ustreznih področij.

Pri analizi rezultatov so ugotovili, da kljub odsotnosti neposrednega citiranja izvirnih znanstvenih člankov, skrite citate velikokrat spremljajo citati knjig ali recenzij, ki so z njimi tesno povezane. Opazili so tudi, da se z eksponentno rastjo števila objavljenih člankov veča tudi količina in uporaba skritih citatov. Poleg tega so ugotovili, da so skriti citati pravzaprav univerzalni in se lahko pojavijo v vsaki instituciji, ne glede na raven njenega prestiža. Pri skritih citatih pa poleg splošnih pristranskosti neposrednih citatov, ne opažajo pristranskosti glede na, denimo, spol ali državo institucije. Zato lahko metodologija, uporabljena v tej študiji, sicer upošteva dodatne skrite citate, vendar zgolj odraža že obstoječe pristranskosti.

V zaključku so izpostavili pomanjkanje dostopa do celotnih besedil raziskovalnih člankov. Za natančnejšo klasifikacijo skritih citatov bi potrebovali obsežnejši nabor celotnih besedil, ki zajema več znanstvenih področij. Medtem ko je število citatov in drugih metapodatkov zdaj prosto dostopno za raziskovalne namene, je dostop do celotnih besedil vseh raziskovalnih člankov omejen zaradi komercialnih interesov znanstvenih založnikov.

ZbritOFF je po članku Meng in sodelavci (2024) povzela Tina.

Vir slike & članka: https://doi.org/10.1093/pnasnexus/

Prazen radio ne stoji pokonci! Podpri RŠ in omogoči produkcijo alternativnih, kritičnih in neodvisnih vsebin.

Dodaj komentar

Komentiraj

Z objavo komentarja potrjujete, da se strinjate s pravili komentiranja.