Teknologia albisteak
7

Google Translate eta Wikipedia

Erabiltzailearen aurpegia
Unai Fdz. de Betoño
2010-09-20 : 12:09

Noizean behin artikulu ulerkaitzak egiten dituzte euskarazko Wikipedian. Ez dira ohiko bandalismoko ekintzak, baizik eta itzultzaile automatikoz egindako artikulu-saiakerak. Badirudi gero eta ulerkorragoak direla, gainera. Gero eta txukunagoak, benetan. Duela hilabete batzuk zuzenean ezabatzen genituen, baina azken boladan zalantza sortzen zaigu: ezabatu, ala akatsak zuzendu?

Google Translate euskaraz agertu berri izanak zerikusirik izango du, ziur aski, automatikoki itzulitako artikulu horien kalitatearen hobekuntzan. Itzulpen estatistikoan oinarritzen bada ere ―kantitatean, alegia―, Googleren tresnak emaitza dezente onak ematen ditu, ulerkortasun orokorrari dagokionez, behinik behin. Haren agerpena baino lehenagoko itzulpen automatikoak kaskarragoak zirela esango nuke. Mormoiak, esaterako, erruz saiatu ziren 2009ko maiatzean, nahiko emaitza eskasa lortuz:


Argazkiak.org | Web 3.0 (antisemantikoa) © cc-by-sa: Unai_Fdz._de_Betono

Google Translateren euskarazko alpha bertsioa publiko egin zen aurtengo maiatzaren 14an, eta, hurrengo egunean, 15ean, honako artikulua agertu zen euskarazko Wikipedian:


Argazkiak.org | Itzultzaile automatikoa Wikipedian © cc-by-sa: Unai_Fdz._de_Betono

Google Translate erabiliz itzuli zuen Avilésko IP anonimo batek. Wikipediako estilo-arauetara egokitutako formatua egokia bazen ere, artikulua berehala ezabatu genuen, ez baitzen ulergarria. Hilabete bat geroago, gaita-jotzaile asturiar baten biografia ―kasualitatea?― pasatzen saiatu ziren teknika berdina erabiliz. Autopromozioagatik (ere) ezabatu genuen.


Argazkiak.org | Itzultzaile automatikoz egindako autopromozioa © cc-by-sa: Unai_Fdz._de_Betono

Azken egunotan, berriz, hurrengo artikulua agertu zaigu euskarazko Wikipedian:


Argazkiak.org | Itzultzaile automatikoz egindakoa © cc-by-sa: Unai_Fdz._de_Betono

Esango nuke itzulpenaren kalitatea dezente hobea dela. Beharbada, gramatika aldetik sinpleagoak direlako esaldiak, besterik gabe. Artikulu berdina gutxienez beste hamabost hizkuntzatara itzuli du egileak. Horietatik, zazpi ezabatu dizkiote ―hurrengo irudian ikusten den bezala―, euskarazkoa tartean. Antza, euskararekin ez ezik, beste hizkuntza batzuekin ere zailtasunak dauzka Google Translatek.


Argazkiak.org | Jeff Gordon artikuluaren historiala © cc-by-sa: Unai_Fdz._de_Betono

Itzulpengintza automatiko kuantitatiboaren alorrean aurrerapausoak laster ikusiko ditugula esango nuke. Idazteko modua ere egokitu beharko da, jakina. Esaldi laburragoak, sinpleagoak, eta zehatzagoak idatzi beharko ditugu. Web semantikoa esaten zitzaion horri, oker ez banago. Badakit horrela ez dugula hizkuntza lar aberastuko, baina Wikipedia dezente handitu ahal izango dugu. Azken finean, entziklopediaren irakurleak datuak baino ez ditu bilatzen. Lirikaz beste batzuk arduratu daitezela.

Erantzunak

Gari Araolaza
2010-09-20 : 13:04

Baina, hau spammerren kontua izango da, ez da? Hau da, demagun pertsona batek nahi duela bere Wikipediako artikulua, errelebantzian eta famoseoan ikusteko. Orduan, itzulpen automatikoa erabilita Wikipediako hizkuntza guztietan kargatzen du.



Nik itxura hori hartzen diot, zuek ez?

Mikel Haranburu
2010-09-20 : 13:50

Artikulu kopurua erraz emendatzeko aukera da, translator zer hori, baina artikuluak ahalik eta lasterren zuzendu behar direla uste dut. Begira ezazue http://eu.wikipedia.org/wiki/1978ko_Sanferminak eta barre egingo duzue ausarki.

Unai Fdz. de Betoño
2010-09-20 : 17:47

@Gari Araolaza: Bai, bai, gehienetan spam mota bat da, oraingoz. Hala ere, aipatu ditudan lau kasu horietatik autopromozioa bi artikulutan soilik zegoen, akaso (mormoien kasuan eta gaita-jotzailearen kasuan). Hala ere, ulertzen ez ditudan arrazoiengatik, pertsona batzuei beren pilotu kutunenari buruzko artikulua euskaraz ere egotea gustatzen zaie (aipatu dudan azken kasuan bezala), nahiz eta euskara ez ulertu. Hori ez da spam, nire ustez. Askotan egoten dira itzulpen-eskariak (nik jaso dudan azkena hauxe da). Google Translatek eskari horiek bideratzen lagundu dezakeela uste dut.


@Mikel Haranburu: Artikulu hori oso gaizki dago, bai. Euskara ikasten ari den kataluniar batek egin du. Google Translate euskaraz jarri baino lehenago idatzi zuen, hala ere. Eskerrik asko oharragatik.


assar
2010-09-20 : 23:54

@Mikel: Hombre, barre egin baino hobe konpontzen saiatzea, ez? Hasi hemendik:
http://eu.wikipedia.org/w/index.php?title=1978ko_Sanferminak&action=edit

Sustatu
2010-09-21 : 11:41

Jokin Lacallaren galdera gaur: "Spamerrak izango ote dira Google-en tresnak bueltatzen dituen itzulpenen kalitatea hobetzen gehien lagunduko dutenak?"


Izan ere, horra Google Translate-ren erabilpen spamatzailearen adibide gehiago euskaraz:


  • Maileguei lotutako spam-a

  • Ezkongabeak lagun bila

Mikel Haranburu
2010-09-21 : 12:49

@assar: banuen asmoa artikuluari heltzeko, baina zuzendu baino, osatzeko, handitzeko ere; baina ez naiz oso trebea Wikipedian, eta denbora ere behar da. Barre egitearena ez nuen esaten asmo txarrez; izan ere, itzulpen automatikoak aukera asko ematen du barrerako, besterik gabe. Orain jakinik katalan batek egin duela sarrera hori, txalo egiten diot, eta eskertzen bere ahalegina. Ea gauza garen denon ekarpenez laster 100.000 sarrerako Wikipedia egiteko...!

assar
2010-09-21 : 13:40

@Mikel Haranburu: Ondo, Wikipedian egingo dugu topo.


Bitor lankideak artikulu hori idatzi zuenean, oraindik ez genion esan Euskara ikasten ari txantiloia erabili behar zuenik.


Bitor lankidearen azken 500 ekarpenak, hemen.


Erantzun

Twitter ikonoa  Facebook ikonoa  Sartu

Publizitatea

Jarraitu sustatu.eus

E-postaz, mezuz mezu:

E-postaz, eguneko buletina:

  • rss ikonoa

»» Aukera gehiago