Teknologia albisteak

Wikidata, 100 milioi elementu zortzi urtean

Erabiltzailearen aurpegia
Sustatu
2020-10-07 : 13:27

Wikidata 100 milioi elementu identifikatura iritsi zen atzo. Wikipediaren oinarrizko datubase sistema indartsu bat da Wikidata, eta Wikipedia bera baino dexente gazteagoa da: 8. urteurrena bi aste barru beteko du, urriaren 29an. Hala ere, bere garrantzia eta irismena funtsezkoa da Wikipediarentzat eta, bereziki, euskarazko Wikipediarentzat.

Arrazoi teknikoengatik 10.000.000 zenbakia duen elementua ezin izan da sortu, baina hurrengoa bai, Q100000001 identifikatzailea daraman elementua, Australiako ikastetxe bat. Izatez, 100 milioi baino gutxiago dira benetako elementuak, bikoizketa asko egon daitezkeela susmatzen dutelako kudeatzaile: 90 milioi item. Azalpen batzuk, blog sarrera honetan.

Wikipedia denok kontsultatzen dugu eta Wikidata ere bai, zeharka bada ere eta zer den jakin gabe ere. Baina funtsezko osagarri bat da sareko entziklopedia erraldoi handian. Ea azaltzen dugun adibide batekin: Wikipediako orri jakin bat eguneratzeko aukera dugu denok. Hona Garbiñe Biurrun epailearena, adibidez. Jaio zen urtea dakigu (1960), baina ez bere urtebetetze zehatza zein egunetan den. Bada, datu zehatz horretaz jakingo balu inork, Biurrunen orria baino, Biurrunen Wikidata orria osatzea hobe luke, eta datubase erako alorretan osatu datua. 

Urtebetetze data zehatzaren datuarekin, ez bakarrik agertuko litzateke adin zehatza Biurrunen euskarazko Wikipedia orrian (59 edo 60 urte dituen orain Biurrunek, zalantza dugu), automatikoki eguneratuko litzateke horixe bera katalanezko bertsioan ere.

Hain zuzen ere, datubase linguistikoki neutral batetik (horixe baita funtsean Wikidata) datu egituratuak erauzi daitezke edozein hizkuntzatan... teorikoki, tartean lan pixkat egin beharra baitago "infotaulak" egituratzen. Beste adibide bat, ikusi Moskuko Bolxoi antzokiaren orria. Testuan, parrafotxo parea besterik ez dugu euskaraz, baina aldameneko infotaulan, eskubian, eraikinaren kokapena mapan, eta datu zehatz mordoa datoz. Datu horiek ditugu euskarazko Wikipedian, Wikidata datubasean hornituta daudelako.

Gaur egunean infotaula eta halako elementu zurrun samarretan ikusten dugu Wikidataren isla euskarazko Wikipedian eta bestelakoetan, baina denborarekin gaitasun hau hedatuz joango dela ziur gaude. Aktore baten orrian, bere filmografia osoa automatikoki agertuko zaigu, adibidez.

Izan ere, Wikidataren sortzailea, Denny Vrandecic, beste proiektu batean abiatu da aurten: Abstract Wikipedia. Asmoa da, ondo ulertu badugu, tauletan egituratu daitekeen informazioaz gain, artikuluen azalpen sakonagoak ere kodetzea modu "abstraktu" edo linguistikoki neutral batean, eta ondoren, elementu abstraktu horiek isla izatea hizkuntza desberdinetako wikipedietan, ez taula gisa, baizik eta hizkuntza naturaleko parrafo gisa.

Abstract Wikipedia garatu ahala, aurrerapausua izan daiteke hori ere euskarazko Wikipediarentzat. Emaitza ez da beheralakoa izango: euskararen prozesamendu naturalean lan egiten duten ikerlari eta profesionalen bitartekaritza ere beharko da, baina iritsiko da egun hori ere. Bitartean, zorionak Wikidata! Eta zorionak Garbiñe Biurrun, ea kasualitatez gaur den zure eguna!

Erantzun

Sartu