LINGUATEC IA, adimen artifizialaren bidez aragoiera, euskara, katalana eta okzitaniera digitalizatzen aurrera egiteko proiektua
LINGUATEC IA, adimen artifizialaren bidez aragoiera, euskara, katalana eta okzitaniera digitalizatzen –
- Pirinioez eta mugaz gaindiko Europako proiektu honek oinarriak ezarri ditu Pirinioen bi aldeetako baliabide gutxiko hizkuntzei aplikatzeko moduko adimen artifizialeko ezagutza garatzeko
- Hizkuntza horietan hizkuntza-eredu sortzaile berriak aplikatzea du helburu proiektuak, zeina Elhuyarrek lideratzen baitu (Orai adimen artifizialeko zentroaren bidez) eta EGEFen finantzaketa jaso baitu (POCTEFA 2021-2027 programaren bitartez)
Hizkuntza-prozesamendua tresna indartsua da baliabide urriko hizkuntzak dituzten erkidegoentzat, hizkuntza biziberritzen eta haren erabilera eraginkortasunez sustatzen laguntzen baitu. Hizkuntza horientzat berebiziko garrantzia du adimen artifizialaren olatura igotzeak, atzean ez geratzeko. Hizkuntza naturalaren prozesamenduan lortutako kalitatea ez dago hizkuntza guztien eskura, eta lankidetza funtsezkoa da hizkuntza-baliabide eta -tresna berriak garatzeko. Berrikuntzako ahalegina areagotu beharra dago, eta apustu egin hizkuntza naturalaren prozesamendurako adimen artifizialaren arloko ikerketa aplikatuaren alde.
EFA 104/01-LINGUATEC IA (Adimen Artifiziala) Europako proiektuak, zeinak Eskualde Garapenerako Europako Funtsaren finantzaketa jaso baitu INTERREG POCTEFA 2021-2027ren 1. deialdiaren bitartez, bi helburu ditu; batetik, baliabide gutxi dituzten hizkuntzei aplikatzeko moduko hizkuntza-eredu sortzaile berriei buruzko adimen artifizialeko ezagutza garatzea eta, bestetik, eredu horiek erabiltzea aragoiera, katalana, euskara eta okzitaniera (POCTEFA lurraldeko hizkuntzak) digitalizatzen aurrera egiteko eta mugaz gaindiko azpiegitura linguistiko adimendun bat eraikitzeko, zeinak erraztuko baitu hizkuntza desberdinetako hiztunen arteko komunikazioa eta informazioa ele anitzetan eskuratzea.
Mugaz gaindiko proiektu honen partzuergoak, Elhuyar buru dela (Orai adimen artifizialeko zentroaren bidez), kide hauek ditu: Lo Congrés Permanent de la Lenga Occitana, HITZ zentroa (EHU), Tolosako Jean Jaures Unibertsitatea, Perpinyàko Unibertsitatea, Baionako IKER-CNRS, Aragoiko Gobernua eta Lleidako Unibertsitatea. Partzuergo horrek bere lan-oinarriak ezarri ditu, Usurbilen (Gipuzkoan) urtarrilaren 15ean egindako lehen bileran. Partzuergoa “Pirinioetako sei hizkuntzen inguruan komunitate zientifiko bat osatzen duten goi-mailako zenbait erakundek osatzen dute, zeinak hizkuntza horiek berreskuratu eta biziberritzeko helburua baitute”, adierazi du LINGUATEC proiektuaren koordinatzaile Josu Aztiriak. Proiektuak “mugaz gaindiko lurraldeko gizartea eta kultura egituratzen laguntzen du, tokiko kulturaren funtsezko elementu bat indartuz: hizkuntzak”, gaineratu du.
Ildo horretan, proiektuan parte hartzen duten erakundeek jada lanean dihardute hizkuntzaren prozesamenduarekin lotutako zenbait eremutan, hala nola konputazioko eta hizkuntza-baliabide mugatuko egoeretara egokitutako arkitektura neuronalak eta algoritmo berriak garatzen. Halaber, “euskararen, katalanaren, okzitanieraren eta aragoieraren eta haien dialektoen transkripzioko, itzulpen automatiko neuronaleko eta ahots-sintesiko sistemak hobetu nahi ditugu, frantsesarekin eta espainierarekin konbina daitezen —adierazi du Aztiriak—, bai eta automatikoki azpititulatzeko eta bikoizteko hizkuntza-plataforma eleaniztun bat garatu ere”. Gainera, “aurreikusi dugu onlineko plataforma edo gordailu bat sortzea Pirinioetako hizkuntzetarako garatzen ditugun baliabide, teknologia eta aplikazio guztiekin”, gaineratu du.
Proiektu hau osatzen duten erakundeek uste dute beren lana oso lagungarria izango dela “bai hizkuntzen eta haiek digitalizatzearen arloan lan egiten duen ikertzaile- eta profesional-komunitatearentzat, bai erakunde publiko eta pribatuentzat, beren zerbitzuak hobetu eta zenbait hizkuntzatan eskuragarri jarri ahal izango baitituzte”, eta harro daude “herritarrei ingurune eleaniztun batean errazago komunikatzen laguntzeko baliabide eta tresna baliagarriak eskaintzeaz”.
LINGUATEC IA proiektua ez da orain jaioa. Izan ere, LINGUATEC proiektuaren lekukoa jasotzen du. Aurreko proiektu hark POCTEFA funtsen finantzaketa jaso zuen, eta jada amaitua da; horretan, hiru urteko ibilbidearen ondoren eta garapen-maila handia lortuta, erakunde bazkideek urrats estrategikoa eman zuten, eta adimen artifizialeko bikaintasun-sare bat finkatu zuten mugaz gaindiko hizkuntza-azpiegitura bat eraikitzeko.
Proiektuak Eskualde Garapenerako Europako Funtsaren (EGEF) baterako finantzaketa jaso du