Elhuyarrek, beste hainbat euskal erakunderekin batera, parte hartu du Europako puntako hizkuntza-teknologietako adituek burutu duten azterketa batean. Azterketak ohartarazten du Europako hizkuntza gehienek ez bide dutela bizirik iraungo aro digitalean.
META-NETek, 34 herrialdetako 60 ikerketa-zentroz osatutako bikaintasun-sare europarrak, egindako azterketa baten arabera, Europako hizkuntza gehienak digitalki iraungitzeko arriskuan daude. Azterketa horretan parte hartu dute Europako puntako hizkuntza-teknologietako 200 adituk, eta, haien arabera, Europako 80 bat hizkuntzetatik 30etan hizkuntza-teknologiek duten babes-maila aztertuta, 30 hizkuntza horietarik 21etan “hutsa” edo “eskasa” da digitalki garatzeko babes edo laguntza.
200 adituk baino gehiagok prestatu dute azterketa, eta META-NET Liburu Zurien Bildumako 30 liburukitan argitaratu da (sarean nahiz inprimatuta eskura daitezke). Azterketa horretan, hizkuntza bakoitzak hizkuntza-teknologien arloan duen babesa azaltzen da, lau arlo desberdinetan: itzulpen automatikoa, ahots-bidezko interakzioa, testu-analisia eta hizkuntza-baliabideen eskuragarritasuna. Aztertutako 30 hizkuntzetatik 21 (%70) mailarik beherenean kokatu dituzte adituek, gutxienez arlo batean “babes hutsal edo eskasa” izateagatik. Zenbait hizkuntzak, hala nola islandierak, letonierak, lituanierak eta malterak, lau arloetan jaso dute puntuaziorik baxuena. Espektroaren kontrako muturrari dagokionez, nahiz eta adituek kontsideratu duten “babes bikaina” duen hizkuntzarik ez dagoela, ingelesa soilik jo da “babes ona” duen hizkuntzatzat, eta haren atzetik daude alemana, espainiera, frantsesa, italiera eta nederlandera, “babes ertainaz”. Bestalde, euskarak, katalanak eta galegoak, bulgariera, greziera, hungariera, eta polonierarekin batera “babes zatikatua” dute, eta, hortaz, arrisku handiko hizkuntzen multzoan ezarri dira horiek ere.
“Gure azterketaren emaitzak oso dira kezkagarriak. Europako hizkuntzarik gehienek behar baino baliabide gutxiago dauzkate, eta haietariko zenbait erabat baztertuta daude. Zentzu horretan, gure hizkuntzetariko asko ez daude prest etorkizunari aurre egiteko”, dio Hans Uszkoreit katedradunak, META-NETeko koordinatzaile, DFKIko (Alemaniako adimen artifizialerako ikerketa-zentroko) zuzendari zientifiko, eta azterketaren koeditore denak. Azterketaren beste koeditoreak, Georg Rehm doktoreak, (DFKI) hau gaineratzen du: “Berebiziko aldeak daude, hizkuntza-teknologien babesari dagokionez, Europako hizkuntza eta teknologia-eremu batetik bestera. Hizkuntza ‘handien’ eta ‘txikien’ arteko tartea gero eta handiagoa da. Bermatu egin behar dugu hizkuntzarik txikienak eta baliabide murriztukoak ezinbesteko oinarrizko teknologiez hornituko direla; bestela, hizkuntza horiek digitalki iraungitzera kondenaturik daude.”
Herrialdeen arteko ia muga guztiak kentzea lortu du Europak. Haatik, oraindik ere bada muga bat, eta badirudi gaindiezina dela: hizkuntza-eragozpenen muga. Muga ikusezin hori da, hain zuzen, jakintzaren eta informazioaren joan-etorria oztopatzen duenetariko bat. Hizkuntza-teknologiek itzulpen automatikoko sistema modernoen bidez hizkuntza-eragozpenak gainditzeko aukera ematen badute ere, META-NETen azterketaren emaitzek argi erakusten dute Europako hizkuntzarik gehienak ez daudela oraindik prest. Hutsune nabarmenak daude teknologian, zeren I+G proiektu gehienak ingelesean oinarritzen baitira, konpromiso eta diru-baliabide falta baitago, eta, orobat, ikerketarako eta teknologiarekiko ikuspegi garbirik ez baita garatu.
Europako Kontseiluak, irailaren 26an, Europako Hizkuntzen Eguna ospatzen du, gure kontinenteko hizkuntza- eta kultura-ondare aberatsa sustatzeko eta garatzeko garrantzia aitortzen duen eguna. META-NETen azterketan ikusi denez, ezinbestekoa da Europan ekimen koordinatu eta eskala handiko bat sortzea, falta ditugun teknologiak garatuko baditugu eta teknologia ahalik eta hizkuntza gehienetara transferituko badugu. Arrazoi sendoak daude berebiziko erronka horri ekimen bateratu baten bidez aurre egiteko, Europar Batasunaz, hura osatzen duten estatu eta herrialde elkartuez nahiz industriaz osatutako ekimen bateratu batez.
META-NET Liburu Zurien Bilduma: Euskara aro digitalean
META-NETen “Hizkuntzak Europako informazio-gizartean” Liburu Zurien Bildumak Europako 30 hizkuntzaren egoeraren berri ematen du, hizkuntza-teknologiei dagokienez; halaber, haien arriskurik larrienak eta aukerak zein diren ere azaltzen du. Euskararen egoera Euskara aro digitalean Liburu Zurian azaltzen da.
Liburu horretan parte hartu du Elhuyarko hizkuntza-teknologien I+G unitateak. Elhuyarko hizkuntza-teknologien I+G unitateak hizkuntza-teknologien ikerketan eta garapenean dihardu, eta hainbat baliabide eta tresna garatzen ditu. Ikerketa-ildo nagusiak hauek dira: lexiko- eta terminologia-erauzketa, informazioaren berreskurapena eta erauzketa (IR-IE), corpus-baliabideak –Zientzia eta Teknologiaren Corpusa, www.ztcorpusa.net; Eroski Consumer Corpusa, corpus.consumer.es–, corpus-tresnak, semantika eta ontologiak, itzulpen automatikoa –OpenTrad–, Sentiment Analysis –BOM-, eLearning –MobLang-. Hainbat ikerketa estrategiko martxan dituzte hizkuntzen industriarekin –Berbatek, www.berbatek.com– eta turismoarekin lotuta. I+G unitatearen ikerketa-lana ezagutarazteko, hainbat argitalpen egin ditu lantaldeak.
Dagoeneko, hizkuntza-teknologiek eguneroko ataza asko errazten dizkigute. Europan, ehunka enpresa txiki eta ertain espezializatu dira hizkuntza-teknologien zenbait aplikazio edo zerbitzutan. Izan ere, hizkuntza-mugak gaindituz, elkarlanerako, ikasteko, negozioak egiteko eta jakintza partekatzeko aukera ematen dute hizkuntza-teknologiek, direnak direla trebetasun informatikoak.
Josu Waliñok erantzun dit Twitterretik laburpeneko informazioa eta hizkuntzen sailkapena hemen aurki daitekeela:
http://www.meta-net.eu/whitepapers/key-results-and-cross-language-comparison
Hor ageri diren taulekin irudiak egin eta hemen itsasten ditu. Euskara hirugarren multzoan dago hirutan, eta laugarren edo ahulenean batean, itzulpen automatikoari dagokionean.
Argazkiak.org | Europako hizkuntzak eta teknologia © cc-by-sa: sustatu
Argazkiak.org | Hizkuntza prozesamendua © cc-by-sa: sustatu
Argazkiak.org | Testu prozesamendu informatizatua © cc-by-sa: sustatu
Argazkiak.org | Testu eta ahots baliabideak © cc-by-sa: sustatu
Ez dut oso ondo ulertzen emaitza horiek.
Nola leike ingelesak ez iristea Babes bikaina duten hizkuntzen mailara? Ez dago, beraz, ikertutako Europako 30 hizkuntzen artean maila gorenera iristen denik? Mailaketa altuegia jarriko ote zuten, ala? izan ere, ingelesa ez badago maila gorenean, bada, akabo!
.@elhuyar eta, 21 horien zerrenda irakur daiteke? taularen bat badago non 30 hizkuntzen balorazioa begirada batean ikus daitekeen? Eskerrik asko.