Aspaldidanik ari da Jaime Gómez-Obregon kantabriarra administrazioek argitaratutako datuekin lanean. Datuen berrerabilera eta datuetara sarbidea erraztu asmoz Kantabriako Aldizkari Ofizialarekin hasi zuen bere lana, twitter bidez han argitaratutakoak banatzen. Baina agian bere lan nabarmenena Kantabriako administrazioen kontratu guztien bilatzailea egitea izan da. Orain Espainiako administrazio guztien kontratuekin dihardu lan bera egin nahian.
Sarri esan izan da administrazioen datu-irekien atariak, "datu-zaborrontzi" ere izan direla, bertan datuak argitaratu baina administrazioek gogo asko gabe egiten duten zerbait delakoan. Administrazioen datu-iturri nagusienetako bat beren kontratuen informazioa da: administrazioak legez derrigortuta daude kontratuen inguruko informazioa argitaratzera (aurrekontuak, eskariak, esleipendunak, prezioak, ...). Sarri, baina, administrazioek informazio hori argitaratzen duten atariak oztopoz betetako atariak izaten dira: eremu asko dituzten bilatzaileak, webgune geldoak, informazioa erraz berrerabiltzeko oztopoak... hemen dago adibidez Eusko Jaurlaritzaren bilatzailea.
Hori hartu zuen aitzakia gisa Jaime Gómez-Obregon-ek, eta Kantabriako gobernuaren ataritik informazio guztia erauzi eta Contratos de Cantabria ataria prestatu zuen. Bertan erabiltzera hain ohituta gauden Interneteko bilatzaileen eredua jarraituz, bilaketa kutxa bakarra jarri zuen eta bertan edozer bilatuta, sartutako testua duten kontratuak aurkitzen dira: berdin da kontratuaren izena, administrazioarena, esleitzailea, data... sartu, bilatzaileak bilatu egiten du. Gainera kontratuak elkarrekin erlazionatuta ditu eta enpresa bat bilatuz gero enpresa horrek lortutako kontratuen zerrenda, esleipenak eman dizkioten administrazioen zerrenda, edo azken urteetako bilakaera ere era txukun baten erakusten ditu. Pentsaezina da horrelako zerbait lortzea administrazioaren atarian. Twitterreko hari baten bildu zituen egindakoak.
Hori hurrengo mailara eraman eta azken hilabeteotan Espainiako administrazio guztien datuekin lanean hasi da horrela Espainiako Gobernuaren plataforma hobetu nahian. Lan horretan hainbat oztopo aurkitu ditu: gaizki idatzitako IFK zenbakiak, iraganeko kontratuak, inolako balidazio gabeko enpresa izenak eta abar luze bat. Twitterren idazten dituen hariekin garbi gelditzen ari da, kontratu publikoei dagokionez bederen, administrazioek ez dutela inolako datuen balidaziorik egiten.
Helburua, ordea, garbia du: Kantabrian egin zuen bezalako bilatzaile bat egitea Espainiako kontratu guztiekin. Lan handia izango da, baina emaitza ikusgarria izango da.
Gurera etorriz, urri-azaro inguruan, Jaimeren lanean inspiratuta, ni ere antzeko zerbait egiten hasi nintzen EAEko datuekin. Horretarako Eusko Jaurlaritzaren kontratazioaren plataformako datuak deskargatu eta prozesatzeko programak prestatu nituen eta baita datuak atzitzeko bilatzaile bat ere. Twitterren eman nuen horren berri.
Hala ere, datuen kalitatearekin egin nuen topo: ez egoen enpresak identifikatzeko modurik, administrazioen identifikazioa ere hala moduzkoa zen, datak ez zeuden ondo, datuak ez zeuden guztiz osatuta, Jaurlaritzak berak ere bi formatu desberdinetan ematen zituen datuak... Baina hala ere, bilatzaile txukun bat lortu nuen.
Hala ere, datuek kalitate eskasa eta guztia ondo prozesatu eta lantzeko behar zen lana nolakoa zen ikusita alde batera utzi nuen proiektua. Hala ere proiektu horretarako sortutako script eta programa guztiak GitHuben argitaratu nituen lizentzia libre batekin edonork erabiltzeko bezala. Hemen daude programa horiek: kontratuak deskargatu eta prozesatzeko scriptak, bilatzailea bera, eta bilatzailearen interfazea. Inork erabili nahi baditu hor daude.
Gif honek erakusten du apur bat instalatuz gero nola funtzionatuko duen:
Erantzun
Sartu