Teknologia albisteak
2

Testuak lantzen: "Athletic" eta "Real Sociedad", zein da nagusia komunikabideetan?

Erabiltzailearen aurpegia
Koldo
2010-05-20 : 10:05

Joko moduan hartu daiteke. Gure egunkari batzuetako webguneak aztertuta, zeinetan aipatzen da gehiagotan "Athletic" edo "Real Madrid"? "Erreala" edo "Athletic"? "Lopez" edo "Zapatero"? Testuak lantzeko PERL programazio-lengoaiarekin "erraz" egin daiteke hori. Jendeari horrelako programatxoekin "jolasten" irakasteko liburu bat, blog bat eta uztailean UEUn ikastaro bat prestatu dugu.

prentsometroa.pl programa 20 bat lerroko gure ariketa bat da. Hori martxan jarrita une horretan bi hitz zenbatetan agertzen diren kontatzen da, komunikabideen zerrenda batean. Adibidez:

user]$ perl prentsometroa.pl "Athletic" "Erreala|(Real Sociedad)|(la Real)"

_________Egunkaria_________________Athletic_______Erreala|(RealSociedad)|(la Real)

  • http://www.berria.info_______________8_____________0
  • http://www.sustatu.com______________0_____________0
  • http://www.argia.com________________0_____________0
  • http://www.deia.com_______________226_____________0
  • http://www.gara.net_________________0_____________2
  • http://www.eitb.com/albisteak_________4_____________0
  • http://www.diariovasco.com__________2_____________277
  • http://www.noticiasdenavarra.com_____4_____________3
  • http://www.ljpb.com_________________0_____________0
  • http://www.elcorreo.com___________486_____________6
  • http://www.elpais.com_______________0_____________0
  • http://www.elmundo.es_______________3_____________1
  • http://www.abc.es___________________6____________21
  • http://www.lemonde.fr_______________0_____________0
  • http://www.nytimes.com_____________12_____________0
  • http://www.guardian.co.uk___________6_____________0
  • http://www.diariodenavarra.es_______0_____________0

Uztaileko ikastaro horren helburua ikaslea ariketa horiek exekutatzeko eta moldatzeko gai izatea da. Beraz, ikuspuntu oso praktikoa izango du. Ikaslearen parte-hartze aktiboa eskatuko da, ariketen azalpentxo bat egin ondoren, ikasleek euren moldaketak lan egin ditzaten, beste ikasleen edo irakaslearen laguntzarekin. Hiru ikasle mota aurrikusten ditugu: "hizkuntzalari", "informatikari" eta "testu- edo Internet-saltsero".

Ikastaroak ez du programazioari buruzko aurre-ezagutzarik eskatzen. Bi aurrebaldintza baino ez ditugu jarriko: bata testu digitalak aztertu eta manipulatzeko interesa izatea, eta bestea, berriz, konputagailu bat eskura izatea berarekin lan egin ahal izateko. Ez duzu besterik behar. Hala ere, konputagailu bat ez badaukazu... ikastaroan informatika-gela batean egingo dugu, eta bertako ordenagailuekin lan egin ahal izango da.

Parte-hartzaileen interesaren arabera ariketa berriak proposatu edo daudenak moldatuko ditugu, baina hasteko liburu eta blogeko ariketa hauek ditugu buruan:

  • Bilaketak egin Interneten. Adibidez, zein dira gaurko Berriaren edizio digitalean gehien aipatu diren 4 izen bereziak? Adibidez: 'Patxi': 325 'Sustatu': 248 'Lopez': 228 'Foru': 198
  • Testu bateko 10 hitz erabilienak aurkitu
  • Bi testu konparatu, hitz eta esaldi komunak bistaratuz. Ea testu bat bestearen kopia ote den aztertzeko balio dezake
  • Hitz-bukaera eman eta testu batean edo webgune batean bukaera horretarako errimak aurkitu. Adibidez: Llorente → inuzente, dexente, ...

Aitzol Astigarraga, Koldo Gojenola Galletebeitia, Kepa Sarasola Gabiola eta Aitor Soroa

Erantzunak

Julen Aseginolaza
2010-05-20 : 14:46

Baina... Berriako datuak ez du ezertarako balio: Real idazten dute Berrian, eta ez Erreala.

Aitzol Astigarraga
2010-05-24 : 14:43

Arrazoi duzu, Julen. Konpontzeko, programa-deia moldatuko dugu "Real" ere bilatu dezan:


user]$ perl prentsometroa.pl "Athletic" "Erreala|Real|(Real Sociedad)|(la Real)"


Umm... baina orain Real Madril eta Real Union ere harrapatuko dizkigu programak. Nola egin hauek albo batera utz ditzan?


Erantzuna oso erraza da. Pista gehiago behar duenak, Testuak lantzen


Erantzun

Sartu