Teknologia albisteak

Ahotsak Corpusa: aldaerak estatistikoki eta mapetan

Erabiltzailearen aurpegia
2013-07-09 : 10:02
Ahotsak Ahozko Corpusa izendatu dugun proiektu honen helburua da ahozko materialean oinarritutako corpus linguistiko bat osatzea. Euskal Herriko Ahotsak proiektuan zehar egindako transkripzioetan oinarrituz, 1900-1950 bitartean jaiotako euskaldunen bat-bateko hizkera naturalaren ezaugarriak bildu nahi ditu.
. Hizlarien lekukotasunak oinarri hartuta, ondorengo informazioa jasoko dugu:

  1. lema bakoitzaren aldaerak;
  2. aldaeren eta lemen banaketa geografikoa;
  3. datu estatistikoak.

Kasu guztietan, bildutakoaren transkripzio-zatia eta bideoa kontsultatzeko aukera ere eskaintzen da.

Oraindik ere Beta fasean gaude, lematizazio fase esperimentala garatzen eta eskuzko zuzenketak egiten (ahozko lagin batean ez dagoelako lan automatikorik egiterik). Webgunean aurkituko dituzun datuak eta emaitzak, beraz, ez dira inola ere behin betikoak. Saio esperimental baten emaitza gisa ulertu eta erabili behar dira. Corpus irekia da, gainera, etengabe ari baikara transkripzio gehiago egiten eta materiala aztertzen.

Hona zenbait hitz interesgarri:


Behean, Bakoitz hitzarekin agertzen zaizkigun datuetako batzuen pantaila-irudia.

Bakoitz, ahotsak mapan


Bakoitz, Ahotsak corpusean



Erantzun

Sartu