Ber2Tek: hizkuntza, ahots eta multimedia teknologiak hizkuntzen industriaren zerbitzura

  • Hizkuntzen industriarentzako irtenbide praktikoak izan ditu helburu ikerketa-proiektu estrategikoak
  • Hiru demo garatu dira: literatura-kritiketako iritzien erauzketa automatikoaren demoa, bideoetako bilatzaile baten demoa (transkripzio eta bikoizketa automatikoa) eta onlineko ahots bidezko hizkuntza-irakasle pertsonal baten demoa

 Usurbilen, 2015eko maiatzaren 29an

Ber2Tek ikerketa-proiektuaren emaitzak aurkeztu ziren asteazkenean Usurbilen, Elhuyarren egoitzan egindako ekitaldian. VICOMTECH-IK4 teknologia-zentroak, TECNALIA Research and Innovation Fundazioak, UPV/EHUko Aholab eta IXA ikerketa-taldeek eta Elhuyarrek osatutako partzuergoak egin du ikerketa, hiru urtez (2012-2014), Eusko Jaurlaritzako Ekonomiaren Garapen eta Lehiakortasun Sailak eta Hezkuntza, Hizkuntza Politika eta Kultura Sailak diruz lagunduta, Etortek programaren bidez.

Ber2Tek: hizkuntza, ahots eta multimedia teknologiak hizkuntzen industriaren zerbitzura

Ber2Tek proiektuaren helburu nagusia izan da hizkuntza- eta hizketa-teknologiak ikertzea eta ikerketaren emaitzak aplikazio bihurtu eta jendearen eskura jartzea. Teknologia horiek hizkuntzen industrian zertan lagundu dezaketen erakusteko, hiru demo eraiki dira, edukien, itzulpenaren eta hizkuntzen irakaskuntzaren arloetarako; izan ere, hizkuntzen industriak eta, bereziki, euskararen industriak, teknologia aurreratuak behar ditu eskura ingurune globalizatu, interkonektatu eta eleaniztun honetan lehiakor izateko.

Edukien arlorako, iritzien erauzketa edo sentimenduen analisiaren teknologia zer den erakusten duen demo bat muntatu dugu. Demoak testu bat hartzen du, iritzi subjektiborik baduen aztertzen du, eta, baldin badu, hura positiboa edo negatiboa den ondorioztatzen du, automatikoki. Teknologia horrek aplikazio ugari izan ditzake, eta bereziki interesgarria da enpresentzat, erraz jakin baitezakete berei edo beren produktuei buruz sarean zer esaten den (toki askotan eta hizkuntza batean baino gehiagotan). Demoa egiteko, armiarma.eus webguneko “Kritiken hemeroteka” baliatu dugu (hainbat komunikabide eta argitalpenetan ateratako euskarazko 5.000 kritika literario baino gehiago biltzen ditu), eta hango kritika bakoitzari puntuazio bat esleitu zaio, automatikoki, Ber2Tek-en garatu dugun euskarazko iritzien erauzketaren teknologia aplikatuta. Demoaren webgunean egilea, obra, urtea edo bestelako parametro bat aukeratuta, grafikoki ikus daitezke puntuazioak, eta kritika bera eta hango hitz positibo eta negatiboak azter daitezke (hitz horietan oinarritzen da teknologia puntuazio bat esleitzeko).

Itzulpenaren arlorako, bilatzaile multimedia bat prestatu dugu. Gaztelaniaz edo euskaraz dauden hainbat bideo hartu dira, eta, ahots-ezagutza erabilita, automatikoki transkribatu. Hala, behin bideo horien testua lortuta, bilaketak egin daitezke bideootan eta, nahi izanez gero, zuzenean jauzi egin bilatutako hitza esaten den unera. Transkripzio horiek, gainera, automatikoki itzultzen dira gaztelaniara, euskarara edo ingelesera, eta, beraz, azpitituluak automatikoki sor daitezke hizkuntza horietan. Eta, itzulpen horietatik abiatuta, hizketaren sintesiaren teknologia erabilita, audioa sor daiteke; hots, bikoizketa automatikoa egin. Bideo horiek hizlari jakin batzuen hitzaldiak diren kasuetan, gainera, xede-hizkuntzako bikoizketak jatorrizko hizlariaren ahotsa imita dezake, ahotsaren transformazioaren teknologia erabilita.

Azkenik, irakaskuntzaren sektorerako, hizkuntzen irakaskuntzako tutore pertsonal baten demoa egin dugu. Duela 3 urte, BerbaTek proiektuaren amaieran, antzeko bat egin genuen, baina oraingo honek aukera gehiago ditu. Gainera, hura mahaigaineko aplikazio bat zen, eta oraingo hau online dago eta edonork proba dezake. Demoko tutorea 3Dko avatar bat da, eta harekin euskaraz komunikatzen gara, ahoz (berak euskaraz hitz egiten du, eta euskaraz ahoz esaten zaiona ulertzen du). Tutoreak gidatzen gaitu aditza, deklinabidea edo ulermena lantzeko automatikoki sortutako ariketetan; gure ahoskera ebaluatzen du; aditz jakin batzuen jokabideari buruz galdetu diezaiokegu; zenbaki bat nola idazten den kontsultatu; hiztegian hitz bat bilatzeko eska diezaiokegu, eta berak hainbat hiztegitako emaitzak erakutsiko dizkigu…

Ber2Tek: hizkuntza, ahots eta multimedia teknologiak hizkuntzen industriaren zerbitzura

Ber2Tek proiektuaren aurretik, 5 eragileek osatutako partzuergoak BerbaTek proiektuan jardun zuen, 2009-2011 tartean, eta beste hiru demo egin zituen. Lehenago, Anhitz proiektuan ibili ziren elkarrekin, 2006 eta 2008 artean, eta zientzia-aditu birtual baten demoa prestatu zuten. 2002-2004 aldian, berriz, Hizking XXI proiektua gauzatu zuten.

Ber2Tek proiektuaren gaineko azalpen guztiak emateko eta demoak aurkezteko asteazkenean Usurbilen, Elhuyarren egoitzan, egin zuten agerraldian, hiru lagun hauek parte hartu zuten:

  • Leire Cancio, Elhuyar Fundazioko zuzendari nagusia.
  • Jokin Azkue, Eusko Jaurlaritzako Hezkuntza, Hizkuntza Politika eta Kultura Saila, Euskara Sustatzeko zuzendaria
  • Igor Leturia, Elhuyarreko I+Gko taldeko kidea eta proiektuaren koordinatzailea.

Ber2Tek-i buruzko artikulua http://www.zientzia.eus/ webgunean

Babesleak:

Elhuyar 1972an jaio zen zientzia eta euskara uztartzeko asmoz. Elhuyarrek Kultur Elkarte bezala egin zituen lehen urratsak eta 2002an Fundazio bihurtu zen. Ordutik, Elhuyar Fundazioak etengabe dihardu lanean zientzia eta teknologia gizarteratzeko eta euskararen garapena bultzatzeko. Elhuyar Fundazioa irabazi asmorik gabeko erakundea da eta hainbat diru-iturriri esker dirau lanean: bazkideen ekarpenak, diru-laguntza publikoak eta Elhuyarrek ekoizten dituen produktuetatik lortutako mozkina. Elhuyarren xedea hauxe da: Euskara zientzian, teknologian eta gizartean sendotzen eta harentzako arlo berriak eraikitzen egiten dugu lan, euskal komunitate aktiboa eta kritikoa helburu.