Kimu izeneko euskarazko hizkuntza eredu txiki bat (SLM, Small Language Model) argitaratu berri du Oraik. Adimen artifizialeko eredu hau oso arina da eta erabiltzaile arrunten ordenagailu eramangarrietan martxan jartzeko modukoa da.
Gemma 2 ereduan oinarrituta, eta euskarazko ZelaiHandi corpus linguistikoa erabilita 2B eta 9B parametro dituzten ereduak sortu dituzte. Horrela, euskaraz oso ondo egiten dakien AA eredu txiki bat lortu dute. Ez da orain arte ezagunak zaizkigun eredu handiak (ChatGPT, Gemini, DeepSeek, Claude...) bezain jakintsua, eta beraz, ez dakizki aktualitateari lotutako datu orokorrak, baina euskaran espezializatua da.
Ezaugarri horiek, oso eraginkorra egiten dute norbere zerbitzarietan martxan jarri eta euskarazko testuak landu nahi dituen edozein enpresa ertain, txiki edo norbanakorentzat. Eredu hau norberak martxan jarri ahal izatea, erraldoi teknologikoei datu konfidentzialak eskeini nahi ez dietenentzat aukera paregabe da.
Zuzenean probatu nahi duenak, Oraik prestatutako txatbotean proba dezake (erregistratzea beharrezkoa da): https://kimu.orai.eus
Edo bestela, AA eredu libreak eskeintzen diren HuggingFace plataforman ere publikatu dituzte proiektuaren fitxategi guztiak edonork berrerabil edo moldatu ditzan: HuggingFacekoa.
Aukera hau aprobetxatuz gainera, Itzune izeneko adimen artifizial eta euskarazko eredu libreak oinarri dituen informatikari aktibista taldeak, AA eredu hauen bertsio konprimatuak Ollama izeneko plataforman publikatu dituzte.
Kimu ereduaren tamaina ezberdinak Ollama plataforman
Plataforma hau oso ezaguna da norberak bere zerbitzarietan edo etxeko ordenagailu propioan AA eredu libreak instalatu eta erabiltzeko. Behin Ollama instalatuta eta Kimu deskargatuta, duela hiruzpalau urteko 16GB RAM memoriako ordenagailu eramangarri arrunt batean Kimu martxan jar daiteke. ZelaiHandi korpusa erabili dutenez eredu txiki hau entrenatzeko, naiz eta jakintza orokorretan (aktualitatea, matematikak...) huts egiten duen, EHko hedabideetan oinarritutako iturrietan egon daitezkeen hainbat jakintza ondo barneratu ditu eta euskal kulturara egokituago dagoela esan daiteke. Kontuz! Hala ere, ikus daitekeen moduan datekin eta datu historikoekin huts egiten du!
Ordenagailu eramangarri batean Kimurekin izandako elkarrizketa
Erabilera posibleak beraz, testuak laburtzea, txosten egiturak sortzea, itzulpenak egitea... izan daitezke. Izan ere, lehen aipatu moduan, hizkuntzan beran da espezialista eta euskaraz gain, gaztelaniaz eta ingeleraz ere badaki.
Errendimenduari dagokionez ere, gastu energetiko gutxi suposatzen du honek, eta oso azkar dabilela iruditu zaigu gainera. Berri oso ona da adimen artifiziala euskaraz nahi dugunontzat!
Erantzun
Sartu