Teknologia albisteak

Googleren emaitzetan katalana gutxiago agertzeko motibo zenbait azaleratu dituzte

Erabiltzailearen aurpegia
Sustatu
2024-06-05 : 09:35

Googleren bilaketa emaitzetan katalanak eta euskarak 2022-2023 tartean izan zuten beherakada dokumentatu genuen webgune honetan. Nolabaiteko konponketa izan zuen gauza hark. Oraintsu, Kataluniatik iritsi zaizkigun azterketa batzuetatik, hizkuntza hauek bilaketetan gutxiago agertzeko motibo batzuen berri jakin dugu. Batetik, Googleren parametro batzuetan bazegoen "tranpatxo" bat. Bestetik, badira enpresa elebidunak Katalunian, apropos katalanezko orrien emaitzak agertzea eragozten dutenak.

 

Googlek egiten zuena (edo duena)

Pasa den maiatzaren 28an sarera filtratu zen Googleren bilaketa algoritmoaren azalpen dokumentu bat. Programatzaile katalan batek zabaldutakoa aztertu du, hain zuzen ere hizkuntza-bilaketen problema hura gogoan.

Firat Negreren irakurketa honen arabera, erabiltzailearen eta bilaketaren hizkuntzaren gainetik, kontestu askotan herrialdeko hizkuntza nagusitzen da; herrialdeak gehienetan estatuak direlarik (Espainia bada entitate erregional horietako bat Googlerentzat, ez Euskal Herria edo Katalunia).

Era berean, Forat Negrek aurkitu du kodean 2022ko urrian sartu behar ziren aldaketa batzuen seinalea. Kronologia bat dator: katalanarentzat eta euskararentzat orduan hasi ziren problema larri samarrak.

Kataluniako enpresa batzuen etxekalte jarrera

Katalanezko teknologiekin lan egiten duen beste garatzaile batek zabaldu du beste datua: enpresa batzuek nahita blokeatzen dute katalana. Hau da, orriak dituzte katalanez beren webgune eleanitzetan, baina robots.txt dokumentuaren bidez, katalanezkoak ez arakatzeko eskatzen diete bilatzaileei (Google eta besteei).

Robots.txt da dokumentu edo funtzio bat egoten dena webgune gehienetan, gidalerroak eskainiz bilatzaileei zer indexatu behar duten eta zer ez norberaren webgunean. Helburu praktikoz egin ohi da, bilatzaileak erabiltzen dituzten erabiltzaileek Google bitartez aurki zaitzaten.

Robots.txt dokumentuak publikoak dira, eta horiek arakatuz jakinarazi du Wecoc1 lagunak zenbait enpresa katalanek ez dutela nahi beren edukiak katalanez indexatu daitezen. Adibidez, Roca komunetako iturgintzako produktuen fabrikatzaileak, goiko irudiak erakusten duen bezala.

Hain zuzen ere, hor duzue Rocaren Robots dokumentua, eta ikusiko duzue, nonbait /eu/ markatutako euskarazko orriak izan daitezkeenak ('eu' da euskararen nazioarteko ISO kodea) ere moztuta daudela... Bitxia, ze aipatzen diren URL-ak hala nola https://www.roca.es/eu/showrooms edo besteak ez dauden, ez da esistitzen euskarazko bertsiorik edo webgunerik gune horretan... Akaso esistitu zen eta damutu ziren?

Eguneraketa, ekainak 7: Jakinarazi digute euskal enpresa batzuek ere egiten dutela hau, euskarazko indexazioari aplikatuta, esate baterako Eroskik bere robots.txt-arekin.

Erantzun

Sartu