Teknologia albisteak
8

Google euskara detektatzen hasi da

Erabiltzailearen aurpegia
Sustatu
2008-10-14 : 10:10

Googlek Ajax Language API delakoaren bidez ematen dituen zerbitzuen artean, testu jakin baten hizkuntza detektatzeko aukera dago, eta euskararentzako gaitasuna gehitu diote horri berriki. Googleren bilaketa aurreratuetan, ezin daiteke oraingoz diskriminatu euskara hutsezko orrietan egin dadin bilaketa, baina detekzioa egiteko gaitasuna dutenez, hori ere etor daitekeela pentsa daiteke. Hala ere, katalana askoz aurreratuago dago, eta orain, gainera, katalanezko itzulpen automatikoa azaldu da Googleren zerbitzuen artean.

Web bidezko zerbitzuak ematen dituen gailu bat da Google Ajax Language API delakoa. Bere funtzioa zera da: Googlek dituen gaitasun batzuk, zure webgunean zuzenean integratzeko modua eskaini. Hizkuntza detekziorako eta itzulpen automatikorako gaitasunak dira horiek, eta Ajax teknikari bidez integratzen ahal dira webgune jakin batean, javascript programazio apur batekin.

Adibideetan eta zerrendatutako hizkuntzen artean ikus daitekeenez, hizkuntza detekzioaren zerrendan, euskara ere ageri da duela egun batzuetatik. Itzulpen automatikorako gaitutako hizkuntzen artean, berriz, euskara ez dago, baina bai, duela bi astetik, katalana.

Katalanezko testu batzuekin jolasteko (edo gaztelaniazkoak katalanez emateko), hemen duzu aukera: http://translate.google.com/translate_t

Horrez gain, orri soil bat ere prestatu dugu hau nola dabilen azaltzeko: detektagailua.html

Hiru gauza jarri ditugu hor.

  • Berezko detektagailu hori, esaldi bat sartu, eta zer hizkuntzatan dagoen erantzuten dizu.
  • Programazio bidez, euskarazko esaldi bati Googlek igartzen dion hizkuntzaren adibidea.
  • Programazio bidez, guk kodean gaztelaniazko esaldi bat sartu, eta Googlek katalanera itzuli.

Erantzunak

asier
2008-10-14 : 12:33

Interesgarria, oso. Sarean egon nahi badugu, Googlen egon behar dugu. Hori horrela da. Googlek hainbat erreminta ematen ditu dozenaka hizkuntzatan (tartean katalana), baina euskaldunak ez gaitu aintzat hartzen. Oraingoz. Guztion esku dago euskarazko eduki gehiago sortzea, eta euskara gero eta nabarmenago egitea Interneten. Horrela egiten badugu, Googlek izango du gure berri eta gehituko gaitu bere hizkuntza zerrendan. Aurrerapauso handia izango da.


Hizkuntza-detektagailu horren inguruan, hitzak ez ezik, izen-abizenak ere ezagutzen ditu. "Luistxo Fernandez" idatzi eta "basque" erantzuten du (eta "ez da fidagarria"; ez dakit emaitzaz ari den ala zer :-) )


Luistxo
2008-10-14 : 12:50

Ja ja... Ez naiz fidagarria! Asier ere Basque omen da, baina hori ere, ez da fidagarria.


Nicolas Sarkozy sartu, eta frantsesa. Baina ez da fidagarria.


Sustatu
2008-10-14 : 12:54

Emandako erantzunaren indizea ez da fidagarria, horixe adierazten du esaldiak. Googleren APIak ematen duen erantzunean, Reliable edo Non-Reliable terminoak itzuli ahal izan ditugu, eta horien ordez jarri dugu Fidagarritasuna eta Ez da fidagarria.


Hizkuntzaren izena ingelesez erantzuten du APIak demo honetan: programazio apur batekin hori aldatzea egongo da, baina ez dugu hartu horrenbesterainoko lanik.


Bestalde, detektatzetik haratago badoa Google eta euskarazko emaitzen filtroa ezartzen badu bilaketetan, bilaketa hori seguruenik ez da Elebila bilatzaileak egiten duen mailara iritsiko, Elebilak (Microsoften bilaketa zerbitzuak erabiliz) terminoen analisi morfologikoa egiten duelako, eta Googleren bilaketak termino zehatzaren gainean egin ohi dira.


Sustatu
2008-10-14 : 17:44

Itzulpen automatikoko sisteman, URL batekin ere egin daiteke proba. Eitb.com berriaren sarrera orria gaztelaniaz dagoenez, www.eitb.com URL-a gaztelaniatik katalanera pasatuta, emaitza hau dugu:


Saguarekin kurtsorea itzulitako esaldi baten gainean uzten baduzu segundu batzuetan (klik egin gabe), gaztelaniazko originalarekin lehio bat irekiko da, eta itzulpena hobetzeko aukera ere eskainiko dizu Googlek.


Ander
2008-10-15 : 11:24

....katalanak aurreratuago.....



zapi milioi hiztun dira. Hiztunen kopuruak egiten ditut hizkuntzak interesgarri enpresentzat.



Irtenbide bakarra dago: izan euskaldun, egin euskaraz, kopurua handitu.



Aitor
2008-10-15 : 13:04



Tresna bera ere ez da oso fidagarria. Nire ikasle denborako latinaz gogoratuz, bi esalditxo txiki jarri dizkiot. Lehenengoan (habemus papam) filipinera zela esan dit; bigarrenen (dominus vobiscum) bielorrusera.

Makina pertsona batzu8¡k bezalakoa ote da? Hau da, ezjakintasuna aitortu baino lehen, edozer erantzun.

Gari
2008-10-15 : 18:10

Aizu Aitor,


Eta begiratu diozu zein fidagarritasun maila ematen duen?


eta begiratu duzu ea identifikatzen dituen hizkuntzen artean latina dagoen?


euskalseo
2010-09-16 : 00:58

Erantzun

Twitter ikonoa  Facebook ikonoa  Sartu