Teknofiloen albistegia
2

Euskarazko errore sintaktikoak detektatzen

Erabiltzailearen aurpegia
IXA taldea
2009-09-30 : 12:09

Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko lehenengo urratsak egin ditu Maite Oronoz IXA taldeko kideak bere tesi-lanean. Esaldien analisi-zuhaitza aztertzeko tresna bat sortu du horretarako: Saroi.

Zenbait sintaxi-erroreren detekzioa eta zuzenketa egin du Maite Oronoz Anchordoquik Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko baliabideen garapena: datak, postposizio-lokuzioak eta komunztadura izeneko tesi-lanean. Alde batetik, esaldiko testuinguru lokala (testuinguruko bospasei hitz) aztertzen du datetan eta postposizioetan gertatzen diren erroreen bila. Bestetik, esaldi-mailara helduta, subjektu, objektu, zehar-objektu eta aditzaren arteko komunztadura-ezak landu ditu. Azken errore mota hori lantzeko esaldiaren analisi-zuhaitza aztertzen du Saroi tresnak (Maitek sortu duena).

Gaur egun ohikoa da 2009-ko irailaren 28 moduko data okerrak idatzita ikustea. Datako elementuak banan-banan hartuta, hitzak zuzenak dira, Xuxen -ek ez ditu azpimarratuko, noski; baina ez al du marratxorik gabe eta irailaren 28a behar? Horrelako erroreak dira detektatu eta zuzentzen dituenak.

Postposizio-lokuzioen detekziorako sintaxi-mailako informazioaz gain, semantika ere behar da. Har dezagun esaldi hau: Oparia LAGUNAK ARTEAN erosi diote. Gu guztiontzako, esaldi okerra da, lagunEN artean beharko luke izan, erraza dirudi detektatzeko ... Ondorengo esaldietan, ordea, egitura berbera edukita, errorerik al dugu?

  1. Suhiltzaile taldeko LAGUNAK ARTEAN ez ziren sua itzaltzera iritsi.
  2. Habia, LAGUNAK ARTEAN ikusi zuen.
  3. LAGUNAK ARTEAN ezagunak egin dira eta Guggenheim-en erakusketa egingo dute.

Egitura sintaktiko zuzen horiek kontuan hartu behar izan ditu Maitek, zuzenak erroretzat ez jotzeko. Esaldiko elementuen ordena kontuan izaten duten erregelak erabili ditu errore mota hauek detektatzeko eta zuzentzeko.

Are konplexuagoa da komunztadura-erroreen detekzioa. Euskaraz, gainera, esaldiko elementuen ordena askea izanik zailagoa da. Ikus esaldiok:

  1. Zentral nuklearrAk zakar erradiaktiboa eratzen dute.
  2. Zakar erradiaktiboa eratzen dute zentral nuklerrAk.
  3. Zentral nuklearrAk eratzen dute zakar erradiaktiboa.

Hiru esaldi horiek desberdinak dira baina analisi-zuhaitz bera dute (ikus goiko irudia). Kasu honetan egokiagoa da erroreak bilatzea analisi-zuhaitzaren gainean. Hori du, hain zuzen ere Saroi tresnak helburua: esaldiaren analisi-zuhaitza eraikitzea eta informazio linguistikoa bilatzeko erregelak zuhaitzetan aplikatzea. Modu honetan, edozein hizkuntza-egitura bilatu ahal izango litzateke euskarazko esaldietan, baita kasu zehatz honetan, egitura linguistiko okerrak ere.

Erantzunak

Pablol
2009-09-30 : 18:38

Zorionak Maite! Gaurtik aurrera arreta handiagoarekin jarraituko ditugu automatei buruzko azalpenak, jejeje







PD: Unibertsitatean IXA Taldearen izena entzuten dudan bakoitzean, gauza bakarra datorkit burura: MARVEL

Inaki Irazabalbeitia, Eleka
2009-10-01 : 14:41

Maiteren lanean oinarrituta dago Xuxen IV zuzentzaile ortografikoarekin batera deskargatu daitekeen estilo zuzentzailea: www.euskara.euskadi.net. Elekak garatu zuen HPSrentzat eta iazko abendutik deskargatzeko moduan dago.

Erantzun

Twitter ikonoa  Facebook ikonoa  Sartu