Captcha-k Luis Von Ahn informatikari guatemalarrak asmatu zituen, eta baita ReCaptcha enpresa sortu eta hura Googleri saldu ere bai. TED hitzaldi honetan (gaztelaniaz), kaptxez gain, bere oraingo ekimen eta enpresaz ere badihardu: Duolingo. Internet osoa itzultzeko asmoa duen sistema bat.
Interneten testua edo datu batzuk sartzean, egilea gizakia dela ziurtatzeko sistemak dira captchak. Von Ahn-en sisteman, irudi distortsioaren bidez aldatzen dira letrak, eta horretan makinek zail duten arren, gizakiek ondo asmatzen dute
Argazkiak.org | Lehen belaunaldiko captchak © cc-by-sa: sustatu
(badaude beste captcha batzuk, linguistikoak, hala nola Sustatun erantzuteko sartu behar dena, edo Eibar.org-eko eta Goiena.net-ek blogetakoak; kasu hauetan detaile matematikoarekin gainera).
Ikerketa proiektu gisa abiatu zen Captcha proiektuari beste kiribildu bat eman zion Von Ahn-ek, kasu honetan enpresa sortuta. Bere kalkuluen arabera, gizaki batek 10 segundu behar ditu captcha bat asmatzeko, eta sarean egiten diren eragiketa guztien artean, egunero milioi erdi lanordu gastatzen omen ditugu, modu konbinatuan.
Denbora gastu hori berrerabil zitekeela-eta sortu zuen reCaptacha. Sistema honetan, hitz bat barik, bi agertzen dira, eta ausaz sortutako letra konbinazioak barik, ondoegi ez zeuden liburu eskaneatuetatik irteten dira hitzak: bat berria eta bestea jada dezifratua, kontrol gisa.
Argazkiak.org | recaptcha adibidea © cc-by-sa: sustatu
ReCaptcha Googlek erosi zuen, eta hari esker, liburuetan OCR irakurgailuek asmatu ez zituzten 100 milioi hitz dezifratzen da egunero, bi milioi liburu inguru urtean. Gainera, mundu populazioaren %13ak, 900 milioi lagunek, egin izan du batean edo bestean lan hau.
Recaptcharen esperientzia, crowdsourcing edo elkarlan masibo hori, orain beste eremu batera eraman nahi du Van Ahn-ek eta horixe azaltzen du bideoaren bigarren partean, 10. minututik aurrera.
Kasu honetan, lortu nahi duen helburua da Interneteko edukia hizkuntza nagusietara itzultzea (horretan ez dirudi oso eskuzabala edo ekolinguistikoa denik Duolingo), eta horretarako, jendeak esaldi laburrak recaptchak bezala itzultzen jartzen ditu.
Baina nork du interesa lan hori egiteko? Captcha bat asmatzeko lana, Interneteko hainbat eragiketaren ondorioa da. Zerk bultza ditzake erabiltzaileek beste langintza horretara? Bada, Van Ahn-en arabera, beste hizkuntza bat ikasteko gogoak.
Eta horixe omen da Duolingo (beta pribatuan oraingoz), ordenagailu bidezko hizkuntzak (hizkuntza nagusi batzuk, alegia) ikasteko metodo bat, non erabiltzaileen ariketetan itzulpen txikiak egiten diren etengabe, eta horien batuketarekin, lortzen omen da kalitate profesionaleko itzulpena, eta sareko korpus handi batzuk itzultzea.
Von Ahn-ek dioenez, Wikipediaren ingelesezko eduki osoa, 100.000 erabiltzailerekin, 5 astean itzul daiteke gaztelaniara; milioi bat erabiltzailerekin, 80 orduan egin zitekeen hori. Hortaz,
Oso bideo eta albiste interesgarria. Eta oso bizkorra Von Ahn hori. Behin eta berriro erakusten du badaudela moduak lan txikiak hartuta, arazo handiak konpontzeko.