Gaztelania-euskara itzultzaile automatikoa egiteko lehiaketaren esleipena egin du Eusko Jaurlaritzak. Lucy Software enpresak irabazi du kontratua, hiru euskal enpresarekin batera (Emergiatech, UZEI, Gizarbitek) aurkeztutako proposamenarekin. Eusko Jaurlaritzak 395.000 euro inbertituko ditu egitasmoa hau gauzatzeko, Enpresa Digitala ekimenaren arabera. Atzo aurkeztu zuen ebazpena prentsaurrekoan Patxi Baztarrika HPSkoak eta aurkezpen horretan emandako testuaren parte bat dakarkigu hona.
TESTU OROKOR EZ-ESPEZIALIZATUAK ITZULIKO DITUEN ESPAINIERA-EUSKARA ITZULPEN AUTOMATIKOKO TRESNA BATEN KONTRATAZIOAREN ESLEIPENA
Itzulpen automatikoa, esan bezala, euskarak behar duen garapen teknologiko garrantzitsua da eta, hori dela eta bai Euskara Biziberritzeko Plan Nagusian bai Euskadi Informazioaren Gizartean Planean jasotako arloa da.
Prozesu luzea izan da Eusko Jaurlaritzarentzat itzultzaile automatikoaren proiektua abian jarri arte. Izan ere, proiektua asko landu behar izan dugu, gure hizkuntzaren garapen-maila, hizkuntza handiekin konparatuz gero, askoz ere apalagoa delako.
Hortaz, euskararako itzultzaile automatikoa garatzeari begira, Hizkuntza Politikarako Sailburuordetzak metodologia bat jarraitu du. Lehenengo eta behin harremanetan jarri zen teknologia hori duten hainbat enpresarekin, hain zuzen ere euskara beren teknologian integratzeko interesa erakutsi zuten enpresekin, eta bakoitzak bere teknologiaren inguruko txosten teknikoa eta bertan euskara integratzeko bideragarritasuna lantzeko eskatu zien.
Horretaz gain, demo praktikoa egiteko ere eskatu zien. Hori egiteagatik enpresa bakoitzak 10.000 euro gehi BEZa jaso zituen. Hauek dira itzulpen automatikoaren arte-egoera ezagutzeko landu zen fasean parte hartu zuten enpresak:
Aipatutako enpresekin izandako saioetatik lortutako informazioa baloratzeko eta ebaluatzeko Kultura Saileko Hizkuntza Politikarako Sailburuordetzak batzorde bat antolatu zuen Administrazioko kideez eta kanpoko adituez osatua. Hauek izan ziren batzordea osatu zutenak:
Batzordekide guztiei eskerrak ematen dizkiegu, benetan euren lana oso garrantzitsua eta ezinbestekoa izan delako prozesu honetan zehar.
Saio horietan ikusitakoa eta ikasitakoa, eta batzordeak osatutako txostena izan ziren, geroxeago, itzultzailea kontratatzeko HPSk prestatu zuen baldintza teknikoen pleguaren oinarri.
Horrela, 2008ko urtarrilaren 4an, Euskal Herriko Agintaritzaren Aldizkarian argitaratu zen testu orokor ez-espezializatuak itzuliko zituen espainiera-euskara itzulpen automatikoko tresna bat kontratatzeko lehiaketa publikoa. Kontratuaren barruan erreminta hornitzea, ezartzea eta hasierako mantentzea sartzen ziren.
Kontratuko betekizunei erantzuteko lau eskaintza jaso ziren, honako enpresa hauenak:
Eskaintzen balorazioa egin du Hizkuntza Politikarako Sailburuordetzak EJIEren laguntzaz, pleguak finkatutako irizpideei jarraituta:
Kontratua Lucy Software enpresari adjudikatu zaio. Kontratua burutzeko Lucy software enpresak Euskal Herriko hiru enpresarekin lan egingo du, hain zuzen ere Emergiatech, UZEI eta Gizerbitek enpresekin.
Lucy Software itzulpen automatikoa lantzen duen eta itzulpen automatikoaren zerbitzuak ematen dituen Alemaniako enpresa da. Bere filiala (%100ean) Bartzelonan dagoen Translendium S. L. enpresa da. Enpresa horren teknologiak urteak daramatza merkatuan oso emaitza onak ematen. Hainbat itzultzaile garatu dute:
Katalana > ingelesa, espainiera, frantsesa
Ingelesa > alemana, katalana, espainiera, frantsesa, errusiera, italiera
Alemana > ingelesa, espainiera, frantsesa, errusiera
Espainiera > alemana, ingelesa, katalana, frantsesa
Frantsesa > alemana, ingelesa, espainiera, katalana
Errusiera > alemana, ingelesa
Kataluniako Generalitat eta Galiziako Xunta Translendium enpresaren bezeroak dira, hau da ezarrita dituzte bere itzultzaileak. Beste administrazio publiko askok ere erabiltzen dute Translendium. Teknologia horrekin ere itzultzen da El Segre Lleidako egunkaria, eta teknologia horren beste erabiltzaile garrantzitsu bat da Agencia Catalana de Noticias.
Euskarazko itzultzailearen garapenean Euskal Herriko hiru enpresak ere parte hartuko dute:
Aurkeztutako enpresen arteko aldeak ezartzeko honako arlo hauek hartu dira kontuan: proposatutako itzulpen-eredua; aurreikusten den itzulpenaren kalitatea; sistemaren arkitektura; proiektuan erabiliko diren hizkuntza-baliabideak; sistema kudeatzeko eta mantentzeko erabiliko diren erremintak; prestakuntza, ezagutzaren transferentzia eta aurkeztuko duten dokumentazio teknikoa; eta, lantaldearen antolaketa.
Aurkeztutako enpresen artean, hiruk (AutomaticTrans, Lucy Software eta UTE Zelai Handi) erantzun diote baldintza teknikoen pleguak eskatutakoari. SHS Polar, berriz, urruntzen da proposatutako eredutik. Aipatutako hiruen artean izan da lehia, beraz, eta nahiz eta hirurak gai izan itzultzailea garatzeko, gure ustez, une honetan egokiena denak irabazi du.
Kontuan izanda, Eusko Jaurlaritzak lortu nahi duen tresna testu orokor ez-espezializatuak itzultzeko dela, eta kontuan izanda, itzulpen-memorietan oinarritzeko sistema eraikitzeko nahiz eredu estatistikoak aplikatzeko, euskaraz corpus handia beharko litzatekeela eta, oraingoz, corpus hori mugatua eta murriztua dela, aukeratu den eredua da arauetan eta transferentzian oinarrituta emaitza hobeak emango dituena. Izan ere, asko baloratu da oinarrizko hizkuntzaren, hau da gaztelaniaren, analisi indartsua duen sistema izatea. Ezaugarri horiek ematen dituen teknologia Lucy Software enpresarena da. Gainera, sistemak itzulpen-memoriak kudeatzeko motorea ere badu integratuta, beraz corpusa handitzeaz eta hobetzeaz batera baliabide hori ere erabili ahal izango da.
Hizkuntza-baliabideak direla eta, Zelai Handi UTEak eta Lucy Software enpresek zehazten dituzte baliabideak, baliabide egokiak hain zuzen; ez dituzte zehazten Automatic Trans eta SHS Polar enpresek.
Lantaldeari dagokionez, oreka eta funtzioen banaketa baloratu da; horretaz gain, proiektuari ezagutza, esperientzia eta baliabideak ekartzea ere baloratu da, bai eta ezagutza transferitzea. Zentzu horretan, Lucy Software enpresaren eskaintza orekatua da, hizkuntza-garapenerako euskararen arloan lan egiten duten enpresekin kontatuko duelako eta, horrek ekarriko du enpresa horiek beste hizkuntzekin oso emaitza onak ematen dituen teknologia ezagutzea eta erabiltzea. Hizkuntzaren garapena oso garrantzitsua da proiektu honetan.
Itzultzailea hiru modutara erabiliko da: Interneten testu laburrak itzultzeko, webguneak itzultzeko, hau da web gune baten edukiak itzultzeko, eta Jaurlaritzako intranetaren bidez, testu luzeagoak itzultzeko; azken horiek giza zuzenketa izango dute eta, horrela, sistema elikatzeko erabiliko dira.
Beraz, gaurtik aurrera 15 hilabeteko epea du Lucy Software enpresak gaztelaniatik euskarara itzultzeko erreminta egiteko. Horren ostean, izango da momentua bestelako garapenekin jarraitzeko: euskara-gaztelania, euskara-ingelesa etab. Proiektuaren kostua 395.000 eurokoa izango da.
Sistema bizia izango da, etengabe hobetzen joango dena. Kontziente izan behar dugu oso desberdinak diren hizkuntzen arteko itzulpenaren emaitza on samarra izateko sistema trebatu behar dela eta erabili behar dela, egokitzen joateko.
Beraz, hamabost hilabete barru lehenengo itzultzaile automatiko izango dugu gaztelaniatik euskarara itzuliko duena.
Donostia, 2008ko uztailaren 24a
Patxi Baztarrika
Eusko Jaurlaritzako Hizkuntza Politikarako sailburuordea
> Patxi Baztarrikaren hitzetan "El primer traductor automático de euskera entrará en servicio en otoño del próximo año"
>
> Ba, nik dakidala badago itzultzaile bat, Opentrad deitzen dena. Eta bidea irekita zegoen, eta euskal enpresa batek egina, eta unibertsitateko teknologia erabiliz, hemengo unibertsitatea....
Bai halaxe da, eta hori ere (unibertsitatea den aldetik) diru publikoarekin egin da; Aurreko lematizatzaile bat ere diru publikoarekin egin zela uste dut, unibertsitateak egin baitzuen, baina gero hori ez dugu zabalik eduki...
>
> Alemaniako enpresa bati eman diote proiektua, primeran, gero +innova programa bultzatuko dute euskal enpresek berritu dezaten... "toma moreno"
Alemaniakoa teknologia da, ez enpresa bera; espero dut UZEIri eta abarri ez ukatzea "euskal naturaleza karta"... ezta moreno?
Ez diote "eman", urte betetik gorako lehiaren ondorioz baino; jarrita daude adituen izen-abizenak eta aditu arloak zeintzuk ziren... lehian onenak irabaziko zutela esperokoa da. (honelakoak herri zintzoetan bakarrik esan daitezke auzitegietan)
Joera daukagu herri honetan korporatibismo ofizialerako (nor duen sarrera zuzena euskal prentsan eta nork ez), and there are many fish in the ocean...
> Aurretik ere antzerakoak eginak daude Scansoft, etab. Non dago Aditu orain, esa didate gor geratu dela...
>
Patxi Baztarrikaren hitzetan "El primer traductor automático de euskera entrará en servicio en otoño del próximo año"
Ba, nik dakidala badago itzultzaile bat, Opentrad deitzen dena. Eta bidea irekita zegoen, eta euskal enpresa batek egina, eta unibertsitateko teknologia erabiliz, hemengo unibertsitatea....
Alemaniako enpresa bati eman diote proiektua, primeran, gero +innova programa bultzatuko dute euskal enpresek berritu dezaten... "toma moreno"
Aurretik ere antzerakoak eginak daude Scansoft, etab. Non dago Aditu orain, esa didate gor geratu dela...