Teknologia albisteak
2

Euskaltzaindiak laster jarriko du sarean XX. mendeko Euskararen Corpus Estatistikoa

Erabiltzailearen aurpegia
2002-02-04 : 13:02

Miriam Urkia UZEIko lankide eta IXAko partaideak eman zigun honen berri, UEUk antolatutako mahai inguruan, Testu eta Hizketa Corpusen gainean. Mahai inguru hau egin zen UEUk aurrera daraman Hiztek graduondoko ikastaroen barnean, pasa den ostiralean Eibarko UEUren egoitzan. Gai interesgarria, zalantzarik gabe, gure hizkuntzaren inguruan kezkarik duen edonorentzat.

Baina beste hizlari batzuek ere izan ziren Itziar Adurizen aginduetara, eta izan zen gauza interesgarririk bai. Besteak beste, Patxi Goenaga euskaltzaina eta Jaurlaritzako Hizkuntza Politikarako sailburuorde berria egon zen, eta hizkuntzari lotutako zenbait proiektu teknologikoren berri eman zuen.

Iñaki Alegria IXAkide eta EHUko irakasleak egin zuen sarrera eta azaldu zuen zer den corpusaren kontu hori, zeintzuk dabiltzan hor eta zertarako balio duen. Komentario zorrotzak egin zituen salatzeko euskarazko corpusak era publikoan kontsultatzeko jartzen ez dituzten erakundeen jokabidea. Askotan irizpide komertzialak jartzen omen dira euskararen beharren aurretik: "Dirua lortu nahi izaten da, eta azkenean ez da dirurik lortzen eta egindako lanak ez dira behar bezala aprobetxatzen". Gainera, Alegriak uste du ez direla urratzen egile eskubideak datu-base bat era horretan sareratzean.

Bestelako iritzi bat azaldu zuen Patxi Goenagak, euskaltzaina eta Jaurlaritzako Hizkuntza Politikarako sailburuorde berriak. Izan ere, entzuleen artean eserita esan zuenez, egile eskubideak omen dira oztopo nagusia Orotariko Hiztegirako erabiltzen den corpusa sarean publikatzeko, argitalpen piraten eta idazle eta beraien oinordekoen beldur dira eta. Momentu honetan arazo teknikoak eta akats handiak omen ditu. "Ez dabil guk nahi genukeen bezala" - esan zuen Patxik- "eta oraindik ez diogu ordaindu egin duen enpresari, guk eskatutako konponketak egin arte". Edonola ere, behin konponketak eginez gero, ez litzateke salgai edo kontsultarako jarriko, baizik eta banatuko litzateke era mugatuan eta kontrolpean, eskatzen duten erakundeen artean (EITB, Aldundiak, Udalak eta abar).

Bestetik, euskaltzainak izan zuen beta Lamiategi proiektuaren berri emateko. Lamiategik biltzen du azken hamar urteotako literatura testuen corpusa. Kasu honetan ez omen da zaila izango iristea 4.000 testu izatera, testu guztiak edo gehienak informatizatuta baitaude. Horregatik, ahal izanez gero 7.000 testu biltzera joko da. Kasu honetan egile eskubideen arazoa konpondua izanen da.

Bide batez, Patxi Goenagak berretsi zuen aurretik Miriam Urkiak bere hitzaldian emandako albistea, alegia, laster, hil honetan akaso, jarriko duela sarean Euskaltzaindiak XX. mendeko Euskararen Corpus Estatistikoa, UZEIk bildu duena. Oraingoz probetarako helbide bat ikusi ahal izan genuen, www.uzei.org . Demostrazioa ikusi ahal izan dugunok txundituta gelditu ginen datubasearen aberastasun eta ahalmenaz.

Karmele Lopez de Ipiña Aholab lantaldeko kideak eskuartean daramatzaten proiektuen berri eman zuen, tartean Bizkaifon Bizkaieraren fonoteka. Laguntza faltaz kexatu zen, hala ere, proiektu asko modu artesanoan atera behar izaten dituzte eta.

Xabier Mendiguren Kontseiluko Lehendakariak pena azaldu zuen gai hauek ez direlako behar bezala aurrera eraman orain dela 10 urte EIZIE, EIE, Euskaltzaindia eta beste aktore batzuekin egin zituzten bileren ondoren corpusa sustatzeko. Ikasliburuen corpusean jarri zuen lehentasuna, hor omen dago-eta nahasmen haundiena gaur egun. Corpusen beharraz hitz egin zuen, euskara lehen mailako hizkuntzen artean egon dadin. Bukatzeko, lan bateraturako deia egin zien hizkuntzaren industrian ari diren taldeei (argitaratzaileak, EIZIE, EIE, Egunkaria, Argia eta abar.).

Erantzunak

Pruden Gartzia, Lamiategi egitasmoaren arduraduna
2002-02-04 : 15:58

Argibide labur bat Lamiategi egitasmoari buruz: helburua 1990eko hamarkadan argiratutako liburu guztiak edo gehienak biltzea da, ez bakarrik literaturazkoak. Helburua hori izanik ere, egitasmo honetako diseinatzaileek garrantzi berezia ematen diegu literaturazko lanei, hitz hori zentzurik zabalenean harturik. Horrek ez dakar, inola ere, beste alderdi batzuk ahanztea; baina proiektuaren bilketa-fasea egiten ez den bitartean ezin da jakin zehaztasun osoz zenbat liburu eta nolakoak bilduko diren, hots, nolako datu-basea egin ahal izango dugun. Izan ere, proiektu honetan orain arte bilketa baino ez da zehaztu.

Gari Araolaza
2002-02-05 : 10:43

Artikulu interesgarri bat hemen software librearen sistematika nola aplikatu daiteken hiztegigintzan.


Erantzun

Twitter ikonoa  Facebook ikonoa  Sartu