Teknologia albisteak

Bilatzaile irekia egiteko proiektuak

Erabiltzailearen aurpegia
Josu Azpillaga - -
2004-04-28 : 13:04

Aurreko mezu baten Sustatu-n bertan esaten zen bezala, mugitua dago sarea bilaketa motore handien alorrean. A9 ezagutu dugu; Yahoo oso berritua eta indartua bilaketetan; MSN ere ba omen dator laster. Zenbait lagun, ordea, arduratuta daude bilatzaileen atzetik enpresa pribatuak daudela ikusita, eta bilatzaile libre eta irekia garatzeko lanean hasi dira.

Google eta beste bilatzaileak

Google eta beste bilatzaileak

Ez dakit Google bilatzaile bat den, edo galderak erantzuten dituen makina bat, baina kontua da denok erabiltzen dugula bera edo antzekoren bat egunero edo ia-ia egunero. Eta berezibiko garrantzia duela jada Interneten. Webguneei buruz, sarritan esaten da: Google-n ez bazara ageri, ez zara esistitzen! (If you are not in Google, you don't exist!)

Azkenaldian, gainera, Interneteko enpresa haundien mugimenduak bilatzaileak indartzeko norabidean doazela ematen du. Hor dago A9.com, Yahoo.com edo Microsoft beraren MSN berritzeko asmoa. Puntocom goraldian bilatzaile zirenak atari erraldoi bilakatzera jo zuten (yahoo, altavista, hispavista...), bilatzaileari berari hasieran zuen inportantzia baino txikiagoa emanez. Gero krisia etorri zen eta badirudi orain, google-n eraginagatik-edo, berriro garrantzia eman zaiola bilatzaileari.

Bilatzaile hauek indartzeko arrazoietako bat, nagusiena seguruenez, komertziala da. Bilatzaile baten, erabiltzaileok garbi adierazten dugu zer nahi dugun: adibidez, "jatetxea Donostian". Eta horrek berebiziko garrantzia dauka komertzialki, publizitaeta sartzerako unean erabiltzailearen beharretara egokitutako publizitatea eskaini baitzenezake. Ez da berdina Donostiko jatetxe baten publizitatea Sustatu-ko portadan ipini, edo konkretuki jatetxe bat bilatzen ari denari eskaini. Hori da, hain zuzen ere google-k egiten duena; hori da, liburuekin, Amazon egiten hasi dena bere A9 bilatzailearekin; eta seguruenez, hori da besteek egin nahiko dutena.

Enpresa pribatuak eta algoritmo itxiak

Bilatzaile haundi hauek hartu duten indarraren aurrean, batzuk oso eszeptiko eta beldurti agertzen dira. Google-n aurkako webgune mordoa aurkitu daiteke Google bertan bilaketa eginda!

Bi ezaugarri nagusi direla-eta zaie beldurra bilatzaile hauei:

  • Bilatzaileen atzean enpresa pribatuak daude: Google, Microsoft, Amazon edo Yahoo.
  • Bilatzaile hauen bilaketa algoritmoa, itxia da. Bilaketak nola egiten dituzten, emaitzak nola ordenatzen dituzten, informazioa nola gordetzen duten, CocaCola-ren konposizioa jakitea bezin zaila dela dirudi. Hasi zaite Google-ren PageRank sistema nola dabilen jakin nahian...

Horren aurrean, batzuk zalantza agertzen dute: nork ziurtatzen du ez dutela tranparik egiten euren bilaketa sisteman? Nola esan genezake "jatetxea Donostian" bilatu ondoren, emaitzen ordena algoritmo garbi batek emango digula? Zenbaitek emaitzetan diskriminazio kometzial edo politikoak egitea ere egotzi diete Google-ri.

Itxura guztien arabera, google-k oso garbi jokatu du beti arlo honetan, ordaindutako informazioa eta besteak garbi bereiztuz. Eurek hala diote behin eta berriro, eurei ere ez zaiela interesatzen tranpa egiten hastea. Baina, batzuk ez dute sinesten... Eta algoritmo itxia denez, ezin ba inork ezer segurtatu.

Bilatzaile irekiak

Orduan, zergatik ez sortu bilatzaile ireki bat, orrialdeak ordenatzeko sistema bistan izango lukeen motorea? Software librearen garapen modeloa (kode irekia, komunitatean lan egitea, ...) zergatik ez erabili bilatzaileen kasuan ere? Helburua, garbia luke: web orri bakoitzak duen garrantzia tranparik gabe neurtu eta haren araberako bilaketa-emaitzak ematea. Edo, tranpa horiek edonoren bistan egotea, behintzat.

Batzuk hasi dira jadanik horretan. Bi dira ezagunenak, edo nik topatu ditudanak behintzat: http://www.nutch.org/ eta http://www.openindex.org/.

Euren webguneetan, proiektuei buruzko informazio gehiago aurkitu daiteke, baina momentuz ez du inork bilaketarik egiteko aukerarik eskaintzen.

Motorea asmatzea bera zaila izanik ere, artikulu honetan irakurri dudanez topatu dute beste zailtasun bat: informazioa hori guztiak gordetzeko eta maneiatzeko moduko kapazitatea nola lortu. Internet arakatu eta bisitatutako orrialde guztien informazioa, non gorde? Eta gero, nola mugitu hori guztia? Memoria eta kalkulu-kapazitate haundia behar da horretarako. Google-k, adibidez, milaka eta milaka ordenadore omen ditu Linux-en gainean paraleloki funtzionatzen. Nola lortu hori proiektu hauekin? Open Index-ek, sarean lan egiten duten ordenadore desberdinak bildu nahi dituela dio horretarako. Lehen ere badira antzeko esperientziak, Seti@Home, adibidez, Sustatun bertan aipatu zena. Edo FightAIDS@Home Sare horretara sartzen direan ordenadoreen kalkulu kapazitatea aprobetxatzen dute eragiketa konplikatuak egiteko.

Noraino iritsiko diren bilatzaile hauek, ikuskizun dago. Nork jakin. Baina, zeinek esango zuen, 1991. urtean Linus Torvalds-ek mezu hau bidali zuenean Linux gaur egun dena izatera iritsiko zenik?

Erantzun

Sartu