Teknologia albisteak

BasqueParl: Eusko Legebiltzarreko hitzaldien hizkuntza-azterketa eta zenbaketa

Erabiltzailearen aurpegia
Sustatu
2022-06-21 : 09:37

Nayla Escribano Hitz hizkuntzalaritza ikertegiko ikertzaileak korpus interesgarri bat prestatu eta landu du: BasqueParl, 14 milioi hitzezko korpus elebidun bat, Eusko Legebiltzarrean 2012tik 2020ra egindako hitzaldien transkripzio multzoa. Laburbilduz, esandako 14 milioi hitz horietan, 3 milioi izan dira euskaraz, eta 11 milioi erdaraz.

Escribanok berak laburbildu zituen aurkikuntza nagusiak Twitterreko hari batean. Horra datu batzuk. Hitz kopuruan proportzioak %79 / %21 diren arren euskararen kaltetan (biribulduz 11 milioi hitz gazteleraz, 3 milioi euskaraz), "hitzaldiak"! kontzeptua ikusita, euskara ageri da hitzaldien %84an, eta gaztelania bakarrik %44an. konparaketak, portzentaia eta zenbaki absolutoetan:

Nola da posible paradoxa? Euskarazko ohartarazpen laburrak oso ohikoak direlako, eta bereziki Legebiltzarreko presidentziatik halako oharrak egiten direlako ohikoan (eta azterketako urteetan, 2012tik, EAJko politikari bat da presidentea: Bakartxo Tejeria). "Hitzaldi" gehienak berriz, presidentziako ohar horiek dira, eta gehienak euskara hutsezkoak dira. Adibidez; "Orain erresoluzioa bozkatuko dugu" edo "Eskerrik asko Iriarte anderea".

Alderdika esaten diren hitzetan, bereizketa egin du ikertzaileak presidentziaren hitzak alde batera utziz gero EAJren datuak alderatzeko. Ondorio politikoak ateratzeko, begiratu grafikoari eta zeuk atera:

Goiko taula hitz kopuruari dagokiona da. Beherago itsatsi duguna hitzaldiena. Ikus, adibide gisa, kontrastea Podemosen jardunean: euskara izan, badago beren hitzaldien %83an, baina euskarazko hitzen proportzioa %7a da. EAJk ere beherakada nabarmena du, hitzaldien %98tik hitzen %33ra.

Izan ere, hitzaldi asko formulazio honekin egiten dira (adibidea ikerketakoa da, ez da esaten noren hitzaldia den):

Hizkuntza analisiaz gain, hizlarien generoa ere aztertu du Escribanok eta hara datua: emakumezkoen ahotsa gutxiengoa izatetik alderantzizko egoerara igaro da hamarkada batean:

Irakur hari osoa, interesgarria da oso.

Ikerketako datuak libre egin dituzte Escribanok eta Hitz zentroak, Legebiltzarreko hitzaldiak eta informazioa libreak baitira:

Erantzun

Sartu