Teknologia albisteak

Google Translate: 24 hizkuntza gehiago, eredu berri batekin

Erabiltzailearen aurpegia
Sustatu
2022-05-14 : 11:06

Google Translatek 24 hizkuntza gehitu dizkio bere itzulpen sistema automatikoari. Kolonialismoak zanpatu baina hil ez zituen Afrika eta Amerikako hizkuntza batzuk daude tartean, hala nola guarani, aimara, bambara edo ewe hizkuntza Ghanakoa.

Teknikoki ere mugarri berria ezarri du Google gehikuntza honekin, ohar honetan azaldu dutenez. Adimen artifizialean oinarritutako Zero-Shot Machine Translation erabiliz lortu dute hizkuntza hauek itzultzeko gaitasuna, eta bere ezaugarri nagusia da corpus elebidunak erabili gabe funtzionatzen duela sistema horrek. Hau da, aymara testuak bakarrik erabilita lortu du Googlek (diotenez) hizkuntza horren modeloa eraiki, eta itzulpenetarako gaitu.

Iruditu zaigu modelo horrek baduela erlaziorik Mikel Artetxe informatikari euskaldunaren lan eta tesiarekin (Itzulpen automatiko gainbegiratu gabea), non korpus elebidunik gabeko hizkuntza txikientzako itzulpen automatikoko prozedura bat landu zuen. Artetxe Facebook-Metako adimen artifizialeko adarrean ari da lanean orain, ez Googlen.

Aproba egin dugu, Googleren iragarpeneko testu bat aimara hizkuntzara itzultzen, eta gero hori euskarara. Hemen pantaila irudiak:

Esaldi bat berezi samar geratu da euskaraz, "hurrengo eguneratzean gaua laguntzen lagundu nahi baduzu...", baina tira, hainbestean.

Ikusi dugu https://translate.google.es/  helbidean daudela jada hizkuntza berriak, ez ordea bilatzaileko orri nagusian integratutako Translate leiho txikiagoan. Gehitutako hizkuntzak hauek dira:

Here’s a complete list of the new languages now available in Google Translate:

  • Assamera, 25 milioi hiztun Indian.
  • Aimara, 2 milioi hiztun, nagusiki Bolivian.
  • Bambara, 14 milioi hiztun Mali eta Senegalen.
  • Bhojpuri, 50 milioi hiztun India, Nepal eta diasporan.
  • Maldivera edo Dhivehi delakoa, 300.000 hiztun, Maldivetako hizkuntza nazionala.
  • Dogri, 3 milioi hiztun India eta Pakistanen,
  • Ewe, 7 milioi hiztun Togo eta Ghanan.
  • Guaraniera, 7 milioi hiztun, Paraguaiko hizkuntza indigena eta nazionala.
  • Ilocano, 10 milioi hiztun Filipinas iparraldean.
  • Konkanera, 2 milioi hiztun, Indian, Goa inguruan.
  • Krio kreolera, Sierra Leonako hizkuntza nagusia.
  • Kurduera (Sorani aldaera), 15 milioi hiztun Irak eta Iranen.
  • Lingala, 45 milioi hiztun, Kongoko hizkuntza nagusia, inguruko herrialdeetan ere mintzatzen dena.
  • Luganda, 20 milioi hiztun Uganda eta Rwandan
  • Maithiliera, 34 miloi hiztun Indian.
  • Manipurera, 2 milioi miloi hiztun Indian.
  • Mizo, 830.000 hiztun Indian.
  • Oromoera,  37 milio hiztun Etiopian eta Kenian.
  • Kitxua, 10 milioi hiztun Perun, Andeetan oro har eta diasporan,
  • Sanskritoa, Indiako antzinako hizkuntza klasikoa (bertako "latina"), 20.000 hiztun ere izan ditzakeena.
  • Sepedi edo pediera, 14 milioi hiztun Hego Afrikan.
  • Tigrinya, 8 milioi hiztun Eritrea eta Etiopian.
  • Tsonga, 7 milioi hiztun Hego Afrikan eta inguruko herrialdeetan.
  • Twi, 11 milioi hiztun Ghanan.

Euskarak 12 urte juxtu daramatza Google Translaten, 2010ean gehitu zuten. Orduan halamoduzko kalitatea zuen, baina gero asko hobetu du; hala ere, uste dugu Elia.eus edo Batua.eus bezalako tresnak, Euskal Herrian sortuak, hobeak direla Google baino.

Erantzun

Sartu