Teknologia albisteak

1.100 hizkuntza audio>testu transkribatzen dituen sistema aurkeztu du Metak

Erabiltzailearen aurpegia
Sustatu
2023-05-23 : 08:53

Metak (Facebook-en enpresak) hizkuntza-ezagupenerako eredu erraldoi bat aurkeztu du eta publikoki banatu Github bitartez: Massively Multilingual Speech (MMS) delako proiektuak, Metaren arabera, hizkuntza-ezagupeneko audio gaitasuna hedatzen du 100 hizkuntza ingurutatik, transkripzioarekin, 1.100 hizkuntzara; eta ezagupen hutsa 4.000 hizkuntzatarainokoa omen da. 

Euskara orain arteko lehen 100 hizkuntza horien multzoan zegoen, baina MMSk hartzen du bere baitan. Metak banatutako mapan (goian itsatsia), testua transkribatzeko gaitasuna puntu urdinek adierazten dute, eta ezagupena puntu berdeek.

Hemen Githubeko proiektuaren orria. Hemen artikulu akademikoa, eta azkenik blog post bat, non bideo batean adibide batzuk ikus ditzakezuen (tartean Irango Gilaki hizkuntza gutxitua, eta Mexikoko zapoteko aldaera bat).

Adimen artifizialeko teknologiekin egin dute MMS. Gailuaren oinarrizko materiala biltzeko testu oso itzulietara jo dute, eta horien artean Biblia, zeinaren inguruan erakunde misiolari grabaketa ugari landu dituzten. Horrela 1.100 hizkuntza horien kasuetan hizkuntza bakoitzeko 32 orduko grabaketak erabili dituzte.

Bada OpenAI enpresa famatuaren (ChatGPT sortu dutenak) ereduetan oinarrituako beste audio-ezagupeneko proiektu bat, Whisper izenekoa, baina Metaren arabera, beraien MMSk bestearen errore maila erdira jaitsi du, eta 11 bider hizkuntza gehiagotara iristen da.

Erantzun

Sartu