Teknologia albisteak

Euskararen Corpus Estatistikoa sarean

Erabiltzailearen aurpegia
Gari Araolaza - C&S
2002-03-09 : 12:03

Duela zenbait aste aurreratu genuen Sustatun XX. mendeko Euskararen Corpus Estatistikoa sarean izango zela. Gaur jakin dugu prentsan webgune hori atzo aurkeztu zela.

XX. mendeko Euskararen Corpus Estatistikoa ** UZEIk Euskaltzaindiaren enkarguz urte luzeetan bildu duen datubase erraldoia da. Datubase honetan XX. mendean euskaraz idatzi diren 4 miloi hitz inguru biltzen dira.

Datubase honen zenbait ezaugarri:

  • Euskalki guztietako testuak azaltzen dira.
  • Garai desberdinduetan banatuta.
  • Lematizazioa integraturik du datubaseak. Hau da, etxe bilatu ezkero, etxetik, etxetako edo etxia eta *etxie" aurkituko dizkigu.
  • Testu osoa SGML bidez markatu da, eta erabiltzaileak erdarak, aipamenak, metahizkuntza eta bestelakoak ere markatuta aurkituko ditu

Tresna oso baliagarria izango da seguru hizkuntzalaritza eta batez ere hiztegigintzarako.

Zorionak beraz, Euskaltzaindia eta UZEIri

Erantzun

Sartu