Umap, Twitterreko euskarazko jardunaren batzailea

Umap-en lehen bertsioa da hau. Funtzio berriak gehituko zaizkio hurrengo asteetan Umap-i. Funtsean, zenbait prozesu automatiko dabiltza martxan aplikazio honetan:

  1. Twitterreko erabiltzaile euskaldunak detektatzeko metodo bat.
  2. Erabiltzaile horien tuit edo mezu guztiak denbora errealean jaso, eta horietan euskarazkoak diskriminatzeko sistema.
  3. Jasotako mezuetan, termino eta gako/trend esanguratsuenak konputatzeko metodoa.

Prozesu hauek ez dira perfektuak, eta asko dute hobetzeko. Baina %100eko doitasunarekin ez bada ere, emaitza zuzenak lortu ditugu. Erabiltzaile euskaldunen detekzioari dagokionez, sinesten dugu potentzialki Twiterren dabiltzan euskaldun guztiak harrapatzeko gaitasuna duela gure sistemak (agian ez da hain hona erabiltzaile robotikoekin). Nolanahi ere, behin euskaldun bat detektaturik, haren mezuetan erdara errepikatzen bada etengabe, ez badu euskaraz idazten, ezabatu egiten du sistemak automatikoki. Datubasean ez dagoen norbait gehitu beharko genukeela uste baduzu, aukera duzu proposamena egiteko orri honetatik; baina ez badu euskaraz egingo, alferrik da.

Euskarazko mezuen detekzioan, %95eko zuzentasunean gabiltzala uste dugu. 1. eta 2. metodoaren artean, euskarazko tuit guztiak ez badira, gehien-gehienak batu eta prozesatzeko gauza gara. Trend edo gakoak konputatzeko metodoan, berriz, algoritmo bihurri samar eta aldakorra erabiltzen dugu, batuketa soiletik haratago; baina funtsean oinarrizko arauak sinplea da: berba bat, puntu bat; #hashtag bat, 10 puntu. Kalkulu sinple hauekin, eguneko komentagaiak, albisteak, eztabaidak jarraitzeko pista interesgarriak lortzen direla uste dugu. Denborarekin, gero eta zehatzago egingo dugu hau, Twitterrera erabiltzaile gehiago gehitu ahala, eta euskaldunok euskaraz gehiago jardun ahala.

 

Euskararen normalizazio komunikatiboaren eta aurrerapen teknologikoaren aldetik, Umap martxan jartzea pizgarria izan daitekeela uste dugu; tarteka euskaraz egiten duenak, motibazio gehigarri bat izan dezake orain euskaraz sarriago idazteko, bere eta bere lagunen mezu-jario edo timeline-etan erdi-galduta geratzen diren mezuak izan barik, Umap-eko jarioetan elkarrizketa aberats eta osoago baten parte izan baitaitezke euskarazko tuitak.

Umap-en hasierako funtzioen artean, honako hauek ditugu:

 

  • Trend edo gakoen jarraipen bizia, hamar minutuero egiten da kalkulua. Azkenekoak, ordu gutxi batzuetakoak konputatuz; gero, azken 24 orduak, azken astea eta azken 30 egunetako gakoak zenbatzen ditugu.
  • Artxibo batean, egun bakoitzeko 24 orduetan gehien errepikatutakoak gordetzen ditugu.
  • Umap bertatik parte hartu daiteke elkarrizketan: egin login zure Twitter erabiltzailearekin, eta retweet-ak zein erantzunak bidali ahal izango dituzu.
  • Erabiltzaile bakoitzaren tuit edo mezuen estatistikak, euskara zenbat erabiltzen duen bakoitzak, bereziki.

Ez bazaude oraindik Twitterren, Umap-eko elkarrizketatik kanpo zaude. Baina komunikazio fenomeno eta informazio tresna oso interesgarri batetik kanpo ere bazaude. Erraza da bat egitea. Sortu kontu bat Twitterren, jarraitu beste zenbait pertsona, hangoak eta hemengoak, eta hasi zu ere tuiteatzen: euskaraz badiharduzu, Umap-ek aurkitu egingo zaitu.

eu.umap.eu

Bai, helbide bihurria da gero: eu.umap.eu. Jarri gogokoenetan zure nabigatzailean, edo Googlen bilatu Umap (agertuko delakoan gaude).

Umap Euskarazkoak badu bere kontu propioa Twitterren, noski. Haren bidez eguneko gako erabilienen abisuak ematen hasiko gara laster, jarraitu nahi bazenitu.

<a class="external-link" href="http://eu.umap.eu">Umap
<script type="text/javascript">
GA_googleFillSlot("Sustatu_b_banner_468x60");
script><script src="http://pubads.g.doubleclick.net/gampad/ads?correlator=1287726073890&output=json_html&callback=GA_googleSetAdContentsBySlotForSync&impl=s&pstok=7x8euhoOfgsKAA&client=ca-pub-6294217621555214&slotname=Sustatu_b_banner_468x60&page_slots=Sustatu_p_goiburua_barrua_990x90%2CSustatu_b_banner_468x60&cookie=ID%3D79bfe70fec5a8721%3AT%3D1282714802%3AS%3DALNI_MZN2Ks2X507x3fpycVWjEgvbjGmkg&ga_vid=1332294509.1282714797&ga_sid=1287725875&ga_hid=1766924345&ga_fc=true&url=http%3A%2F%2Fsustatu.com%2F1287720743&ref=http%3A%2F%2Fsustatu.com%2F&lmt=1287726073&dt=1287726081562&cc=100&biw=1262&bih=579&ifi=2&adk=2033451195&u_tz=120&u_his=15&u_h=800&u_w=1280&u_ah=751&u_aw=1280&u_cd=24&u_nplug=5&u_nmime=40&flash=10.1.85">script><div id="google_ads_div_Sustatu_b_banner_468x60">
<ins style="width: 468px; height: 60px; border: 0pt none; display: inline-table; position: relative;"><ins style="width: 468px; height: 60px; border: 0pt none; display: block; position: relative;"><iframe style="border: 0pt none; position: absolute; top: 0pt; left: 0pt;" marginheight="0" marginwidth="0" name="google_ads_iframe_Sustatu_b_banner_468x60" id="google_ads_iframe_Sustatu_b_banner_468x60" frameborder="0" height="60" scrolling="no" width="468">iframe>ins>ins>div>
<script>GA_googleCreateDomIframe('google_ads_div_Sustatu_b_banner_468x60' ,'Sustatu_b_banner_468x60');script>
  <p><a href="/publizitatea" title="Sustatuko publizitatea">Publizitateaa>p>
div>


<p>p><p>Umap-en lehen bertsioa da hau. Funtzio berriak gehituko zaizkio hurrengo asteetan Umap-i. Funtsean, zenbait prozesu automatiko dabiltza martxan aplikazio honetan:p>
<ol>
<li> Twitterreko erabiltzaile euskaldunak detektatzeko metodo bat.li>
<li> Erabiltzaile horien tuit edo mezu guztiak denbora errealean jaso, eta horietan euskarazkoak diskriminatzeko sistema.li>
<li> Jasotako mezuetan, termino eta gako/trend esanguratsuenak konputatzeko metodoa.li>
ol>
<p>Prozesu hauek ez dira perfektuak, eta asko dute hobetzeko. Baina %100eko doitasunarekin ez bada ere, emaitza zuzenak lortu ditugu. Erabiltzaile euskaldunen detekzioari dagokionez, sinesten dugu potentzialki Twiterren dabiltzan euskaldun guztiak harrapatzeko gaitasuna duela gure sistemak (agian ez da hain hona erabiltzaile robotikoekin). Nolanahi ere, behin euskaldun bat detektaturik, haren mezuetan erdara errepikatzen bada etengabe, ez badu euskaraz idazten, ezabatu egiten du sistemak automatikoki. Datubasean ez dagoen norbait gehitu beharko genukeela uste baduzu, aukera duzu proposamena egiteko <a href="http://eu.umap.eu/u/">orri honetatika>; baina ez badu euskaraz egingo, alferrik da.p>
<p>Euskarazko mezuen detekzioan, %95eko zuzentasunean gabiltzala uste dugu. 1. eta 2. metodoaren artean, euskarazko tuit guztiak ez badira, gehien-gehienak batu eta prozesatzeko gauza gara. <a href="http://eu.umap.eu/t/">Trend edo gakoaka> konputatzeko metodoan, berriz, algoritmo bihurri samar eta aldakorra erabiltzen dugu, batuketa soiletik haratago; baina funtsean oinarrizko arauak sinplea da: berba bat, puntu bat; #hashtag bat, 10 puntu. Kalkulu sinple hauekin, eguneko komentagaiak, albisteak, eztabaidak jarraitzeko pista interesgarriak lortzen direla uste dugu. Denborarekin, gero eta zehatzago egingo dugu hau, <a href="http://twitter.com/codesyntax">Twitterreraa> erabiltzaile gehiago gehitu ahala, eta euskaldunok euskaraz gehiago jardun ahala.p>
<p>Euskararen normalizazio komunikatiboaren eta aurrerapen teknologikoaren aldetik, Umap martxan jartzea pizgarria izan daitekeela uste dugu; tarteka euskaraz egiten duenak, motibazio gehigarri bat izan dezake orain euskaraz sarriago idazteko, bere eta bere lagunen mezu-jario edo timeline-etan erdi-galduta geratzen diren mezuak izan barik, Umap-eko jarioetan elkarrizketa aberats eta osoago baten parte izan baitaitezke euskarazko tuitak.p>

<p>Umap-en hasierako funtzioen artean, honako hauek ditugu:p>
<ul>
<li> Trend edo gakoen jarraipen bizia, hamar minutuero egiten da kalkulua. Azkenekoak, ordu gutxi batzuetakoak konputatuz; gero, azken 24 orduak, azken astea eta azken 30 egunetako gakoak zenbatzen ditugu.li>
<li> Artxibo batean, egun bakoitzeko 24 orduetan gehien errepikatutakoak gordetzen ditugu.li>
<li> Umap bertatik parte hartu daiteke elkarrizketan: egin login zure Twitter erabiltzailearekin, eta retweet-ak zein erantzunak bidali ahal izango dituzu.li>
<li><a href="http://eu.umap.eu/u/irekia_news">Erabiltzaile bakoitzaren tuit edo mezuen estatistikaka>, euskara zenbat erabiltzen duen bakoitzak, bereziki.li>
ul>
<p>Ez bazaude oraindik Twitterren, Umap-eko elkarrizketatik kanpo zaude. Baina komunikazio fenomeno eta informazio tresna oso interesgarri batetik kanpo ere bazaude. Erraza da bat egitea. Sortu kontu bat <a href="http://twitter.com">Twitterrena>, jarraitu beste zenbait pertsona, hangoak eta hemengoak, eta hasi zu ere tuiteatzen: euskaraz badiharduzu, <a href="http://eu.umap.eu/">Umap-eka> aurkitu egingo zaitu.p>

<h3>eu.umap.euh3>
<p>Bai, helbide bihurria da gero: <a href="http://eu.umap.eu">eu.umap.eua>. Jarri gogokoenetan zure nabigatzailean, edo Googlen bilatu Umap (agertuko delakoan gaude).p>
<p>Umap Euskarazkoak badu bere <a href="http://twitter.com/umapEu">kontu propioa Twitterrena>, noski. Haren bidez eguneko gako erabilienen abisuak ematen hasiko gara laster, jarraitu nahi bazenitu.p>




Twitter, umap

Utzi erantzuna

Zure e-posta helbidea ez da argitaratuko. Beharrezko eremuak * markatuta daude