Albistegi automatikoak: Sustatun euskarazkoa, gaztelaniaz Niagarank proiektu berria
Iazko udan jarri genuen martxan CodeSyntax enpresaren teknologiarekin Sustatuko pilotu automatikoa (euskal tuiterlarien artean pil-pilean dauden gaiak jasotzen dituen erreminta). Haren antzeko beste bi garapen ere egin genituen garai bertsuan, Kisale bizikleta dendarentzako albistegi berezitua, eta Nestoria etxe bilatzaile britainiarrentzako albistegia ingelesez. Baina praingo honetan, garapen eta ideia hori 40 aldiz biderkatu dugu, eta Espainiako albiste merkaturako garatu, beste produktu batekin: Niagarank.es. Ezaugarri bera dute tresna hauek: albistegi robotikoak dira, sare sozialetan mugitzen dena detektatu eta argitaratzen dute, adibidez Zuzeu-ko albiste honekin gertatu den bezala.
Sustaturen pilotu automatikoa azaltzeko: Twitterren euskaldunen arreta erakarri duten albisteak detektatzen dituen sistema. Gorabehera batzuk izan dira, baina emaitza ona eman duela uste dugu, eta euskal tuiterlarien artean bizi-bizi dabiltzan gai eta loturak detektatzea lortzen du. Modu honetan funtzionatzen du: 1) Twitterreko euskaldunen jarduna denbora errealean jarraituz, 2) haien euskaraz tuitak arakatzen ditu, 3) estekak zenbatzen ditu, eta 4) garrantzitsuenak identifikatzen. Estekak euskarazko edo erdarazko edukiz hornituta etor daitezke, edo hizkuntzarik gabeak izan, irudi bat adibidez, baina haien inguruko txioak euskaraz idatzita daudelako ekartzen ditugu.
Sustatun jarduera euskaldun osoa albistegi batean kondentsatzen badugu, Niagarank-en, berriz, Twitterren gaztelaniaz pil-pilean dagoen guztia baino (zabalegia bailitzateke), 40 multzo edo gai tematiko definitu ditugu, eta horien inguruan txiokatzen duen jendea jarraitzen dugu. Era berean, eduki detekzioan gaiarekin zerikusia duten parametroak ere sartzen dira. Euskaraz halakorik egitea egon liteke? Ez dugu uste. Komunitatea txikia da, iturriak urriak, eta gai pare batean egin zitekeen agian diskriminazioa, baina ez hortik gora.
Erabiltzaileen Ranking-ak
Albistegi automatiko hauetan, erabiltzaileak detektatu eta rank edo sailkapen baten arabera sailkatzen ditugu. Eta erabiltzaile horietan, 5.000 gehienez jarraitzen ditugu, rank handiena dutenak. Gaur egunean, baliteke 15.000 edo 20.000 tuiterlari euskaldun izatea Twitterren, baina automatikoko “onenak” (komatxo artean uler bedi) jarraitzen ditugu, algoritmo batzuen arabera aukeratuak. Espainiako gaikako sailkapen horretan berdin, gai bakoitzarekin zerikusi “zuzenena” duten erabiltzaileek “rank” handiagoa daukate, eta sailkapen horren arabera jarraitzen ditugu 5.000 “onenak”.
Ondoren, jarraitzen ditugun Twitter kontu horietan jendeak ze esteka partekatzen dituen zaintzen dugu denbora errealean. Esteka horiek elkarren kontra lehiatzen dira, txio kopurua, erabiltzaileen rankinga, denbora/freskotasuna eta beste faktore batzuk kontuan hartzen dituen algoritmo baten arabera. Eta argitaratzeko atalase bat gainditzean, argitaratu egiten dira Niagarank-en edo Sustatun, albistearen snippet edo puska bat, eta harekin batera detektatzen ditugun tuitak, elkarrizketa osatu aldera.
Alderdi teknikoa: Django eta Masonry
Makinaria indartsua dago Niagarank-en atzean: Django framework azpiegitura eta Python programazio lengoaia. Baina diseinuaren aldetik, erabaki desberdinak hartu dira Niagarank-en. Grid esaten zaion bloke-zutabe nahasketa bat da Niagarank-eko interfaze nagusia.
Pinterest zerbitzuak jarri zuen modan duela urte eta erdi, eta Masonry izeneko diseinu-eskemari jarraiki ezarri dugu Niagarank-en. Honek, bide batez, diseinu arduratsua egiten utzi digu, eta mugikor zein tablet-etan ondo egokitzen da maketa: iPad batean egin dezakezue aproba, orientazio bertikal edo horizontalean, nola moldatzen den edukia.
“Garrantzi” elementu bat ere sartu dugu interfazean. Gehiago nabarmentzen diren albisteak beltzez agertzen dira, adibidez (bloke zurietan ere badago ñabardura, argazkiaren tamainan, 2. eta 3. mailakoak bereizteko, nolabait esatearren).
40 gai tematiko
Gaiei dagokienez, 40 dira oraingoz. Sailkapen moduko bat egin dugu, “erreibindikatu” edo “ekonomia” moduko epigrafeekin. Gai batzuk interes orokorrekoak izan daitezke (lan merkatuarena), eta beste batzuk, agian gutxiengo zehatzentzako (ehiza, edo Microsoft produktuei buruzkoa).
Gai horietako bakoitzak Twitter kontu propioa dauka, RSS jarioa, eta baita eguneroko buletina ere. Hau da, Niagarank Tenisa eta Liburuak jarraitu ditzakezu bakarrik, ez besteak, zure interesak horiek badira. Baina azalak bere bizitza propioa du (beste algoritmo batek nabarmenenen hautespena egiten du), eta hori beste kanal batekin doa, @NiagarankEs kontua Twitterren.
Baina aizue albiste hau ez al du errobot hotz batek idatzi?? Kazetari batek idatzi du? Ingeniari batek?
Interesgarria edo interesatua, ez dakit nola definitu…nik “Datsegit”-i eman diot azkenean…