24. 5. 2019 – 7.15

Govori, kar misliš

Audio file

Vmesniki med računalniki in človeškimi možgani so v zadnjem desetletju prešli s področja znanstvene fantastike v konkretno realnost. Aplikacije vmesnikov so številne, ena izmed možnosti uporabe pa je omogočanje govornega komuniciranja za ljudi, ki so nezmožni govoriti. Raziskovalci z Univerze Kalifornija so v nedavni objavi predstavili govorni vmesnik, ki je zmožen hitro pretvoriti mišljene besede v predvajani zvok.

Namen računalniško-možganskih vmesnikov je pretvoriti informacije o možganski aktivnosti v nadzorljivo in predvidljivo dejanje. V primeru govornih vmesnikov bi oseba lahko že z razmišljanjem o govorjeni besedi pretvorila misel v signal, ki bi ga lahko nato naprava spremenila v zvok. S tem bi zaobšli potrebo po uporabi naših govornih organov - ust, jezika, glasilk in pljuč - pri proizvajanju govora.  

Govorni vmesniki sicer obstajajo že danes. Vendar je pomembna omejitev dosedanjih vmesnikov njihova relativna počasnost. Zmorejo namreč proizvesti le okoli 8 besed na minuto, kar je veliko manj kot približno 150 besed na minuto, ki jih lahko povemo v zmerno hitrem govoru. Omejitev v hitrosti izhaja iz dejstva, da poskušajo dosedanji vmesniki informacije v možganih neposredno povezati z določenim zvokom. A razvozlanje možganske informacije za posamezno besedo je z današnjo opremo praktično nemogoče, zaradi česar se trenutno najzmogljivejši vmesniki zanašajo na tako imenovano metodo možganskega tipkanja. Pri tej metodi osebe v mislih črkujejo besedo in šele nato posredujejo skupek črk kot eno besedo. To je tudi razlog za njihovo počasnost.

V omenjeni raziskavi so poskusili avtorji na iznajdljiv način zaobiti opisano omejitev. Namesto neposredne povezave možganske informacije z določenim zvokom so se problema lotili v dveh korakih. Najprej so povezali možgansko aktivnost z gibanjem govornih organov, torej jezika, ust in glasilk, ter šele nato v drugem koraku povezali gibanje govornih organov z določenim zvokom. Izkazalo se je namreč, da se možgansko informacijo veliko lažje prevede v mišične gibe kot pa neposredno v zvok.

Da bi povezali možgansko aktivnost z določenim zvokom, so avtorji izdelali program, ki je analiziral ogromne količine podatkov o možganski aktivnosti ter z njo povezanih gibih govornih organov. Na podlagi analize je nato program predvidel, kakšen zvok bo proizvedla posamezna misel. Poslušajmo sedaj kratek stavek, proizveden z opisanim računalniško-možganskim vmesnikom.    

Posnetek

Če ste v predvajanem prepoznali stavek »Ship building is a most fascinating process«, potem je vmesnik uspešno opravil svojo nalogo. Če niste, se lahko strinjamo, da razviti sistem še ni povsem popoln. Vseeno pa smo lahko navdušeni nad zmogljivostjo vmesnika, ki lahko že dokaj zanesljivo pretvori kompleksne stavke.   

 

Prek špikersko-radijskega vmesnika je Zbritoff delil Arne.

 

Prazen radio ne stoji pokonci! Podpri RŠ in omogoči produkcijo alternativnih, kritičnih in neodvisnih vsebin.

Dodaj komentar

Komentiraj

Z objavo komentarja potrjujete, da se strinjate s pravili komentiranja.