Softver za rekonstrukciju mrtvih jezika

Istraživači univerziteta Berkli napravili su softver koji može da rekonstruiše davno izumrle jezike, objavio je danas britanski javni servis BBC.
1 komentar(a)
Ažurirano: 12.02.2013. 17:13h

Softver može da rekonstruiše protojezike - drevne jezike od kojih su se razvili moderni jezici. Za test sistema, tim stručnaka je uzeo 637 jezika koji su danas u upotrebi u Aziji i na Pacifiku i rekonstruisao jezik od kojeg su nastali. Rezultati njihovog rada objavljeni su u časopisu "Proceedings of the National Academy of Science".

Rekonstrukcijom jezika se bave lingvisti, ali je taj proces spor i zahtijeva veliki rad.

"Ljudima je potrebno mnogo vremena da pregledaju sve podatke. U svijetu postoje hiljade jezika, od kojih svaki ima hiljade riječi, da ne pominjemo pretke svih tih jezika", rekao je profesor univeriteta Berkli Dan Klajn. "Bile bi potrebne stotine života da se svi ti jezici prouče, unakrsno uporede sve različite promjene koje su se na tolikom prostoru i tako dugom vremenskom periodu dogodile. Ali u tome briljiraju računari".

Kroz hiljade godina, sitne varijacije u načinima na koji izgovoramo glasove učinile su da se rani jezici pretvore u brojne različite jezike.

"Te glasovne promjene gotovo su uvijek pravilne, slične riječi mijenjaju se na slične načine, tako da ostaju obrasci koje čovjek ili računar može da otkrije", rekao je Klajn. "Stvar je u tome da se identifikuju obrasci po kojima se te promjene dešavaju i zatim preokrenu, čime se riječ, u suštini, vraća kroz vrijeme".

Naučnici su ovaj sistem demonstrirali obradom grupe austronežanskih jezika koji se danas govore u jugoistočnoj Aziji, djelovima kontinentalne Azije i na Pacifiku. Na osnovu baze podataka koja je sadržala 142.000 riječi, sistem je mogao da rekonstruiše rani jezik iz kojeg su se ti moderni jezici razvili.

Naučnici su procijenili da se taj jezik govorio prije oko 7.000 godina. Zatim su uporedili rezultate računarskog sistema sa onima do kojih su došli lingvisti i otkrili da je 85 procenata ranih riječi koje je proizveo softver spadao u jednu grupu onih riječi koje su i stručnjaci identifikovali.

Mašinski metod je znatno brži ali je zato manje precizan. "Kod našeg sistema još postoje nedostaci", rekao je Klajn. "Na primjer, on ne može da prati morfološke promjene ili reduplikacije - kako npr. kad riječ kao što je "cat" (eng. mačka) postaje "kitty cat" (cica maca). "Naš sistem ne može da objasni zašto ili kako nastaju izvjesne promjene, već samo da pokaže da su se one dogodile", rekao je on.

Dok stručnjaci mogu da rekonstruišu jezike koji su stari i do nekoliko hiljada godina, još je pitanje da li će ikada biti moguće otići dalje i rekonstruisati prvi protojezik, od kojeg su nastali svi ostali jezici koji su danas u upotrebi.

Galerija

Bonus video: