Silicon Valleyko datu-zientzialari batzuek azterketa estatistikoa egin dute munduko ehundaka hizkuntza konparatuz, eta bitxitasunaren arabera sailkatu dituzte; hizkuntza arraroenak zerrendaren goialdean eta arruntenak behean. Emaitzetan, akaso batzuentzat sorpresa dena agertzen da: euskara munduko hizkuntza arrunt eta korrienteenetakoa da. 239 hizkuntzako sailkapenean, 230.a da euskara (!!). Aldiz, gure erdarak, gaztelania eta frantsesa, hizkuntza arraroenetakoak dira, eta baita ingelesa ere.
Azterketa
Idibon enpresak egin du, eta
emaitzen azalpen originala ingelesez hemen daukazue. Baina metodoa eta emaitzak apur bat azaltzeak merezi du, eta saiatuko gara.
Azken urteotan osatzen joan den atlas linguistiko estatistiko bat erabili dute,
WALS delakoa. Munduko hizkuntzen datubase bat da, azterketa honetatik kanpokoa, hizkuntzen ezaugarri estatistiko eta filogenetikoak biltzen dituena. (
Euskara WALS horretan nola ageri den ere bitxia egin zaigu, bide batez, hizkuntza-familia baten gisara...). Dozenaka ezaugarri linguistiko aztertzen ditu WALSek, munduko hizkuntzen artean. Adibidez,
83A ezaugarria, aditz eta objektu zuzenaren arteko ordena.
Faktore hori eta beste batzuk, 21 guztira, aztertu ditu Idibon-ek, hizkuntzen *weirdness* (arrarotasun) fatkorea neurtzeko. Esate baterako,
esku/beso dikotomia, 129A faktorea, adibidez, ea eskua eta besoa adierazteko berba bi ala bat erabiltzen diren hizkuntzetan. Hizkuntza gehiagok (389) dute bi hitz bat bakarra baino (228 hizkuntza). Euskara, bi hitzeko talde nagusian dago; beraz, beste hizkuntzek irabazten dute puntuazio arrarotasun eskalan. Faktore honen ponderazioa, hala ere, txikia da, berba bateko eta biko taldeen artean aldea ez baita hain handia.
Hau da aztertutako faktoreen zerrenda:
Emaitza guztiekin,
kalkulu-orri bat egin dute (beraz, faktore matematikoak ere aurkituko dituzue bertan, interesa baduzue). Sailkapen orokorrean 239 hizkuntza zerrendatu dituzten arren,
kalkulu-orrian askoz gehiago ageri dira, baina sailkapen orokorretik kanpo geratu dira gehienak, ez daudelako dokumentatuak ezaugarri gehienetan. 21 ezaugarri zehatzak ondoen aztertuta dituzten hizkuntzen artean da, beraz, sailkapena.
Eta, horra, ba, emaitza. Munduko hizkuntza arraroena Mexikoko mintzaira indigena bat da, Chalcatongoko Mixteka, 0.972-eko arrarotasun faktore batekin. Arruntena, berriz, hindiera (Indiako hizkuntza hedatuena), 0.087. Euskara, hindieratik gertu, 0.189eko arrarotasunarekin. Gure gertuko erdarak, gaztelania eta frantsesa, biak weird samarrak, 0,789 eta 0,754eko faktoreekin.
Azkenean, arrarotasunaren banaketa geografikoa (ikus itsatsitako mapa), soziolinguistikoa eta filogenetikoa, oso zabala da. Hizkuntza gutxitu zein oso hedatuak aurki daitezke arraroenen artean, edo arruntenen artean. Mexikoko beste hizkuntza indigena bat, Purepecha, da munduko 2. arruntena, Mixtekarekin kontraste eginez.
Hindiera eta gaztelania, biak milioika hiztuneko hizkuntzak dira, indoeuroparrak, baina bata ezaugarri komunez betea dago, eta bestea (espainola), ez. Hindieraren doinua euskaraz dastatu nahi baduzue,
Azpitituluak.com webgunean badaude hindierazko film pare batentzako azpidatziak euskaraz:
Dhobi Ghat eta
Zindagi Na Milegi Dobara. Azken honetan Euskal Herria ere agertzen da, Sanferminak zehazki, horra irudi bat:
Idibon enpresak beste azterketa linguistiko/estatistiko batzuk ere egin ditu, eta datuen erabilpen eta bisualizazioan berezitua dago Kalifornian.
Lantalde interesgarri bat dauka, eta aholkularien artean Louis Monier dago adibidez, Altavista bilatzailearen sortzailea (hemengo zaharrenek gogoratuko duzue). Azterketa hau gidatu duena Tyler Schnoebelen da eta Twitterren aurkituko duzue: (
@TSchnoebelen)
Bitxiak erabat datuak. Ikerketak egiterakoan zeintzu datu ikertzen diren, emaitzak halakoak direla erakusten dute emaitza hauek. Inkestekin ere gauza bera gertatzen da, ezer ez da egia borobila, galdera nola egiten dugun, zein datu ikertzen ditugun, nolako edo halako emaitza lortuko dugu...