Teknologia albisteak

Euskararen Erreferentzia Corpusa sarean, 21. mendeko euskarazko hitzak arakatzeko

Erabiltzailearen aurpegia
Sustatu
atzo : 17:01

Euskaltzaindiak EEC aurkeztu du, Euskararen Erreferentzia Corpusa, duela lau urte abiatutako proiektua, orain webgune eta kontsulta-tresna gisa 1.0 bertsioan sarean jarria. Euskararen 21. mendeko erabilera idatzi erreala kontsultatzeko tresna bat da.

Argitaratutako EECren bertsioak 123.124 dokumentu, 154,21 milioi testu-hitz eta 129.817 lema desberdin biltzen ditu, 2000. urtetik hasi eta 2023ra bitartean euskaraz idatzitako edo ekoitzitako testuetatik datozenak. Liburuetatik datozen testu-hitzak 68,42 milioi dira (% 44,37), aldizkako argitalpenetatik 72,49 milioi (% 47,01), sarerako berariaz idatzitakoak 4 milioi (% 2,59) eta bestelako edukiak (argitalpen bereziak, liburuxkak, gidoiak,...) 9,3 milioi (% 6,03). Ekarpena eginez argitaldari izandakoen zerrendan ez dago Sustatu, ez dakigu zergatik, baina inork ez digu ezer eskatu. Dena dela, gure artxiboa hor dago, 2001. urtetik, eta gure lizentzia libreak baimena ematen du, EECrako erabili nahi balu Euskaltzaindiak.

Lema eta formen araberako bilaketak egiten uzten du EEC-k. Gure proben arabera, emaitza txukunagoak lortzen dituzu forma jarrita. Esate baterako, podcast edo podkast, zer erabili den gehiago. Bi idazkerak bilatu daitezke forma gisa, baina lema gisa bakarrik podcast c-duna agertzen da.

Funtzionalitate nagusiak dira bilatzaile oinarrizkoa, azalean aurkitzen ahal duguna (emaitza adibidea beheragoko irudian), bere bertsio aurretatua, hitzen datuak aurkitzekoa (goiko irudi adibidea horrekin lortua, podkast formaren historiala lortzeko), eta lema eta formen konparatzailea. Esan bezala, formak bilatuta badirudi datu aberatsagoak lortzen ahal direla.

EEC edo Euskararen Erreferentzia Corpusa erabiltzeko, hemen: https://eec.euskaltzaindia.eus/

Honen antza duen beste tresna bat, EEH Egungo Euskararen Hiztegia, EHUren baliabide bat: https://www.ehu.eus/eeh/ 

Erantzun

Sartu