Elhuyar Fundazioak Web-corpusen ataria aurkeztuko du otsailaren 13an

hitzakElhuyar Fundazioak euskarazko Web-corpusen ataria sortu du eta erabiltzaileentzat kontsultagai jarri. Atari hau, datorren otsailaren 13an (asteazkena) aurkeztuko dugu Donostiako San Telmo museoan, “Badu bada” erakusketaren barruan, 17:00etatik aurrera. Sarrera doakoa da, eta nahi duenarentzat dago irekia.

Elhuyarrek sortu dun Web-corpusen atarian, erabiltzaileak hiru baliabide ditu eskura:

– Euskarazko corpus elebakarra:
orain arte eratu den euskarazko corpusik handiena da, alde handiz gainera, 125 milioi hitz inguru jasotzen baititu. Interneten dauden mota eta arlo guztietako testuak biltzen ditu eta linguistikoki etiketatuta dago.

Euskara-gaztelania corpus paraleloa: 18 milioi hitz inguru ditu corpus honek, eta egungo euskara-gaztelaniako corpus paralelo publiko handiena da. Aurrekoa bezala, hau ere linguistikoki etiketatuta da. Oso baliagarria da hizkuntza bateko hitz edo esapide bat beste hizkuntzan nola eman den jakiteko.

Euskarazko corpusetik automatikoki erauzitako hitz-konbinazioak: hiru motatako konbinazioak eskaintzen dira: izen+aditz, izen+izen eta izen+izenondo. Horren bidez, esaterako, erabiltzaileak ikus dezake izen jakin batekin zein aditz konbinatzen diren, neurri estatistiko batzuen arabera ordenatuta, baita horien testuinguruak bistaratu ere.

Nabarmentzekoa da, baliabide horiek Internetetik automatiko eratu direla, Elhuyar Fundazioko I+G taldeak garatutako teknologiari esker.

Guztiaren berri emateko, honako pertsona hauek parte hartuko dute aurkezpenean: Josu Aztiria, Elhuyar Fundazioko Hizkuntza Zerbitzuak saileko arduraduna; Igor Leturia, Elhuyar Fundazioko I+Gko ardurauna eta Antton Gurrutxaga, Elhuyar Fundazioko Hiztegigintzako arduraduna.

Web-corpusen ataria aurkezteaz gain, atari hau eraikitzeko erabilitako teknologia azalduko da, eta horrelako tresna automatikoek hizkuntzaren azterketan, oro har zein lexikografian, sintaxian, semantikan… eta antzeko arlo jakinetan, baliabide gisa duten garrantziaz jardungo dugu.

Sarrea doakoa da, eta nahi duen ororentzat dago irekia, baina aldez aurretik baieztatu beharra dago r.lopez@elhuyar.com helbidera mezu bat idatzita.

Elhuyar 1972an jaio zen zientzia eta euskara uztartzeko asmoz. Elhuyarrek Kultur Elkarte bezala egin zituen lehen urratsak eta 2002an Fundazio bihurtu zen. Ordutik, Elhuyar Fundazioak etengabe dihardu lanean zientzia eta teknologia gizarteratzeko eta euskararen garapena bultzatzeko. Elhuyar Fundazioa irabazi asmorik gabeko erakundea da eta hainbat diru-iturriri esker dirau lanean: bazkideen ekarpenak, diru-laguntza publikoak eta Elhuyarrek ekoizten dituen produktuetatik lortutako mozkina. Elhuyarren xedea hauxe da: Euskara zientzian, teknologian eta gizartean sendotzen eta harentzako arlo berriak eraikitzen egiten dugu lan, euskal komunitate aktiboa eta kritikoa helburu.