Teknologia albisteak

Aina Flor, katalanezko alternatiba librea ChatGPTren teknologiari

Erabiltzailearen aurpegia
Sustatu
2024-01-19 : 11:48

Aina da Katalunian adimen artifizialaren inguruan lanean ari den ekimen publikoa, Bartzelonako Superkonputazio Zentroko Hizkuntza Teknologien Unitateko taldearen inguruan gorpuztua, eta iragarpen inportantea egin du berriki: Aina Flor-6.3B izeneko LLM edo hizkuntza eredu handi berria guztiz Open Source kaleratu du. Katalanez, gaztelaniaz eta ingelesez bildutako 140.000 milioi tokeneko 'corpus' batekin entrenatu da Aina Flor. Bitartean, euskaraz ere hizkuntza eredu handi eta irekia sortzen ari direla jakinarazi zuen atzo Hitz zentroko zuzendariak, Eneko Agirrek, Languages Lanean biltzarrean.

140.000 milioi tokenen artean, 6.3 bilioi parametro gauzatu dira, eta horregatik bertsioak izen hau du: Aina Flor 6.3B. 

Tresnaren berri ematen duen prentsa-oharraren arabera, hizkuntza ereduaren izaera trinkoari esker, mahaigaineko ordenagailuetan erabili ahal izango da Aina Flor, azpiegitura handien beharrik gabe. Hori egia bada, aurrerpausu handia da non ChatGPT edo halakoak bakarrik Interneteko erraldoien lainoko super-ordenagailuetan oinarritzen baitira... Kostu aurrezpena ere badu erabilpenean horrek.

Aina Florren garatzaileen arabera, esandako hiru hizkuntzetan (katalana, gaztelania, ingelesa) honako gaitasunak ditu sistema adimentsuak: laburpenak egitea, erabiltzaileen galderei erantzutea, itzulpena, dokumentuen sailkapena, ad hoc testuak sortzea... Baina ohartarazten dute halaber: bertsio hau esperimentala da, eta sistemak eman ditzake oraindik erantzyn iraingarriak, okerrak edo desegokia. Halako eduki okerrak iragazteko lanean ari dira Aina proiektuan.

Hemen probatu daiteke Aina Flor

Ez dakigu ondo egin ote dugun ala ez, baina hizkuntza ergatiboen inguruko informazioa eskatu diogu, eta erantzunean bat ere ez du asmatu, hizkuntza horietarik bat bera ere ez baita ergatiboa uste dugunez.

Euskaraz halakorik izango ote dugu? Ba lanean ari dira Hitz zentroan. Hala zioen atzo Eneko Agirrek Hitz zentroko zuzendariak Languages Lanean biltzarrean:

"Metak banatutako lizentzia irekiko Llama-ri esker Hitz zentroak euskararako egin den hizkuntza eredu handiena eraikitzen ari da. Kode irekiko IA [adimen artifiziala] plataformak euskarari oso ondo datorzkio."

Hain zuzen ere, Meta/Facebook-eko nagusiak, Mark Zuckerberg-ek, Llama 3 iragarri berri du 2024 honetarako, indar handiko sistema eta oinarria open source edo askea hau ere. Oraingo Llama 2 bertsioaren indarra euskarari aplikatua Metak garatutako Seamless M4T produktuan probatu genuen duela hilabete batzuk, ahozko itzulpen automatiko zuzena euskaraz egiteko gai den tresna bat.

Erantzun

Sartu