Teknologia albisteak

Google Translator Toolkit, sekulako tresna (euskararik gabe oraingoz)

CodeSyntax

2009-06-11 : 10:06

Googlek hizkuntza teknologiei lotutako beste tresna bat kaleratu du, eta ez nolanahikoa: Google Translator Toolkit. Itzulpen memoriak kudeatzeko gaitasunarekin, eta Wikipediarekin bereziki ondo pentsatutako integrazio batekin, sekulakoa dirudi. Sorburu hizkuntza ingelesa da bakarrik une honetan, baina helburu hizkuntzak mordoxka bat (euskara ez, oraingoz).

Argazkiak.org | Google Translation Toolkit © cc-by-sa: sustatu

Goiko adibide horretan, Mikel Laboaren Wikipediako ingelesezko artikulua japonierara itzultzekotan, adibidez, lehen begiratuan testu mordoa eskaintzen digu makinak. Seguruenik (ez dakigu ordea), ez da dena japoniera txukun eta biribila izango, baina zuzenketa batzuekin, testu osoa berregin beharrean, wikipedista japoniar batek erraz sortu ahal izango du beren Wikipediarako Mikel Laboari buruzko artikulua (gaur egunean esistitzen ez dena), horretarako gogoa badu (ikusi pantaila-irudia tamaina handian).

Tresnaren aukeren artean, web orri zein dokumentuak itzultzeko aukera dago. Dokumentuetan, ohiko formatuak: .doc, .html, .odt, .rtf, .txt. Software lokalizazioan erabiltzen den .po formatuaren berri ez dugu ikusi. Hori gehituz gero, handia litzateke hori ere.

Web orrietan, edozein webguneren URL-a sar dezakezu, baina Wikipediakoak eta Google Knol proiektukoak itzultzeko bereziki prestatua dago.

Itzulpen memorien biltegia

Itzulpena egiterakoan, nork bere itzulpen memoriak erabil ditzake (50 Mb arte karga daiteke, Tmx formatuan), eta egiten dituen itzulpenak ere horietara gehituko dira. Itzulpen memoria zera da: testu paraleloen multzokatzea, gero informatika estatistikoz sistemak erabiltzen duenak itzulpen berdinak edo antzekoak proposatzeko automatikoki. Mikel Laboaren irudi adibidean, esate baterako, seguruenik ingelesa-japoniera erako itzulpen memoria mordoa du pilatuta Googlek, eta norbaiten ohar biografiko labur bat izanik, parekotasunak erraz samar aurkitu ditu Googleren sistema informatikoak, japonierazko bertsio bat emateko. Era berean, editore japoniarrak ñabardurak sartzen baditu proposatu zaionean, hori ere Googleren memoriarentzako onura da, testu paraleloen korpusa eta zehaztasuna handitzen da.

Izan ere, horixe dirudi tresna honen gakoa: Googlek bere itzulpen memoriak handitu nahi ditu, itzulpenerako duen gaitasun jada harrigarria (ikus Youtubeko bideoen azpidatziena), are gehiago indartu. Itzultzaileei laguntzen die Googlek, eta bere buruari ere bai. Izatez, norberak sortzen edo kargatzen dituen itzulpen memorien gainean, partekatzeko aukera batzuk daude, eta irekiena da Googleren eskuetan uztea, denentzat baliagarri izan dadin. Wikipediako edukien kasuan, ez dago aukerarik pribazitaterako: memoria kolektibora doa emaitza. Itzulpenak elkarbanatzeko orduan, Google Docs aplikazioko edizio kolektiboko moduko aukera batzuk baditu Translation Toolkit honek.

Euskararen posizioa

Tresnak duen hutsune nagusia, oraingoz, sorburu-hizkuntza bakarra izatea da: ingelesa. Baina hizkuntza-pareetan norabide askotan nola dabiltzan ikusita, hori laster aldatuko dutelakoan gaude. Helburu-hizkuntzetan, euskaldunontzako hutsune hori: ez dago euskara, bai ordea katalana, edo apenas milioi bat hiztun dituen estoniera.

Gure aburuz, tresna honetan eta Googleren gainerako itzulpen aukeretan (Youtubeko horietan, adibidez) helburu-hizkuntzen artean euskara agertzea sekulako aurrerapausua litzateke gure hizkuntzaren aurrerapen teknologikoan, eta are gehiago hizkuntzaren estatusean eta, jakintzaren esparruan, Wikipediako eduki libreen indartzean.

Agian kontu hauetaz jarduteko aukera egongo da bihar Donostian izango den ekitaldi honetan: Andy Way, itzulpen automatiko estatistikoan aditua, gonbidatu du IXA taldeak hitzaldi bat ematera.