Teknologia albisteak

Euskarazko testu sorkuntza automatikoa, Bloom adimen artifizialeko tresnarekin

Erabiltzailearen aurpegia
Sustatu
2022-07-20 : 08:22

Irudi sorkuntza automatikoaz jardun dugu azken aldian: asteburuan, adibidez, Dall-2 tresnarekin jolasean (OpenAI enpresaren garapen bat), eta duela hilabete batzuk GPT-3 tresnaz ere bai, hau ere OpenAI-rena, zeinak testu sorkuntza ahalbidetzen duen ingelesez. Ba orain halako testu sorkuntzarakoBloom azpiegitura garatu dute, libreki banatu, eta izena emanez gero aprobetarako ireki ere bai. Eta euskarazko testua ere sortzen du. 

Hemen dago Bloom. LLM edo Hizkuntza Modelo Handi bat da, 46 hizkuntza natural eta 13 programazio lengoaiatako datuak dituena. 1,6 terabyte testu guztira, 350 bilioi token-etan bilduta. Euskararen presentzia %0.15-koa da korpus horretan, baina konparazioan ez dirudi hain gutxi denik ere. Izatez osatu duten grafiko banatuan, agertu egiten da gure hizkuntza.

E-postaz erregistratu eta izenaz emanez gero, https://huggingface.co/bigscience/bloom orrian bertan eskumatan dagoen interfazean sar daiteke euskarazko esaldi bat edo beste, eta nola jarraitzen duen ikusi. Klik pare bat emanez gero, batzuetan hiruzpalau esaldi osatzen dira, baina ez gehiago.

Parametroen araberako interfaze gehigarri batzuk ere badauede, Bloom Explorer edo Bloom Creates Meme delakoa bezala. Ez dakigu oso ondo nola dabiltzan... meme sorkuntzarekin inork asmatzen badu, abisatu dezala. Bloom Explorer delakoari, berriz, euskarazko galdera bat egin diogu, eta zera erantzuna:

Noiz lortuko du independentzia Euskal Herriak? // ». Horixe galdetu dio El Correo egunkariak gaur bere buruari. Egunkari horren ustez, "

Goiko testuan eta hurrengo adibideetan // zeinuaren aurrekoa guk idatzi dugu, eta ondorengoa makinak.

Interfaze nagusitik ere egin ditugu aproba batzuk, emaitza estandar eta greedy (??) erakoak konbinatuz. Hona emaitza batzuk,

Adimen artifiziala euskararen kasuan nola garatzen den ikusi nahi dugu jakinminez, zeren eta // Nik uste dut etorkizunaren parte dela. Jende asko ari da adimen artifizialaren inguruko hitzaldi eta hitzaldietan, eta nik ere interes handia dut gai honetan, eta uste dut etorkizunerako ere interes handikoa izango dela.



Ilgoropila ere aipatu diogu makina ustez adimentsuari:

Croissant euskaraz zuzen esateko, ilgoropil terminoa onartuko du laster Euskaltzaindiak, eta horrela//akoak, gainera, ez dira gutxi. Arantzazun egin duten bilkuran Euskaltzaindiak aho batez onartu du ilgoropil hitza, eta, beraz, Euskaltzaindiaren Hiztegian agertuko da. Ilgoropil hitzak, ilgoraren ondoren eta ilbetearen aurretik ematen

Goiko adibide honek erakusten duen bezala, puntu jakin batetik aurrera esaldiak mozten ditu eta ezin duzu doako eredu honekin gehiago jolastu.

Poema / abesti pare baten luzapena eskatu diogu. Lau teilaturekin despiste handia hartu du, akaso hobeto ulertu du Bizkaia maite.

Lau teilatu gainean, ilargian erdian, eta zu // zu, zu, zu, zu, zu, zu, zu, zu, zu, zu, zu, zu, zu, zu, zu, zu, zu, zu, zu, zu

Bizkaia maite, atzo goizean ikusi zintudan, soineko zuriz // horrekin. Eta nire bihotza dantzan hasi zen. Maite, maitagarria, zer ondo egin zenuen.

Independentziari buruzko beste galdera bat ere egin dugu, azkenik:

Euskal Herriak independentzia lortzen duenean // ?» galdetu zuen Ibarretxek. «Gaur egun, ez», erantzun zioten. «In

Egin aprobak zuek ere https://huggingface.co/bigscience/bloom gunean.

Erantzun

Sartu