Eleka Ingeniaritza Linguistikoa enpresak publikatu nahi diren dokumentuetatik entitateak automatikoki detektatu eta kentzeko baliabidea garatu du. Entigarbi deritzo.
Zenbait kasutan dokumentuak interneten denen eskura jartzeko nahia sentitzen da, esaterako, itzulpen-memorien kasuan. Dena den, askotan dokumentu hauetan informazio konprometitua egon daiteke (NAN zenbakiak, akusatuaren izena ), eta momentu honetan informazio hori kentzeko modu bakarra dokumentu osoa irakurri eta eskuz kentzea da. Hau oso lan neketsua da eta askotan arrazoi horregatik, edo baliabide faltagatik dokumentuak ez dira publikatzen.
Entigarbik ondorengo entitate hauek detektatzen laguntzen du:
- Zenbaki bereziak: NAN, IFZ, Segurtasun Soziala, matrikula zenbakiak, telefono zenbakiak, kontu-korronte zenbakiakPausu ezberdinetan burutzen da entitateen garbiketa. Lehendabizi, Entigarbik automatikoki entitate batzuk detektatuko ditu. Bigarren pausu batean erabiltzailearen eskuzko lana sartuko da, interfaze bat eskainiko zaiolarik entitateak zerrenda bidez lantzeko, nahiz testu osoa errepasatuz. Azkenik, garbiketa prozesua burutuko da. Azken prozesu hau ere automatikoa da.
Momentu honetan, zerbitzu moduan eskaintzen da http://entigarbi.eleka.net gunean. Probetarako atal publikoan dokumentuaren tamaina mugatuta dago. Hala ere, badu beste atal bat bezeroentzat, pribatua dena, bertan tamaina handiagoko dokumentuak garbitu daitezkeelarik.
Barkatu, goiko mezuan ahaztu zaigu komentatzea Entigarbi tresna garatzeko Eusko Jaurlaritzako Kultura Saileko IKT 2007 deialdian dirulaguntza jaso genuela.
Ondo izan.