Algoritmoak, adimena eta akatsak

Algoritmoak, adimena eta akatsak –

Baina horrekin zaila da konplexutasun maila batetik aurrera joatea: gaixotasunen detekzioa, objektuen identifikazioa eta itzulpen automatikoa bezalako atazak, adibidez, ezin ziren ondo ebatzi. Ataza horien guztien ezaugarri nagusia ezagutzaren izaera da, ezagutza difusoa baita, eta ezagutza hori ezin da Baldin/Errepika egituren bidez bakarrik adierazi, inork ez baitaki algoritmo zehatza zein den. Ataza horietan aurrera egin ahal izateko paradigma-aldaketa gertatu zen, ikasketa automatiko izeneko paradigma berria etorri zen-eta. Metodo matematiko konplexuetan dago oinarrituta (aurreprogramatutako paketetan, software librekoak askotan), eta datuak dira gakoa [5]. Adibidez, gaixotasun baten detekzioa egiteko espediente medikuetako informazioa biltzen da, gaixotasuna garatu duten eta garatu ez duten pertsonen datu asko eta askorekin. Horretan oinarrituta sailkatzaile bat ikas daiteke, datu berriak emanda gaixotasuna garatzeko probabilitatea kalkulatzeko ahalmena duena. Ohiko algoritmoetan ez bezala, halakoetan ezin da espero emaitza zehatzak izatea, errore-tarte bat dago beti, horixe baita aipatutako ataza adimentsuen ezaugarria. Ikasketa sakonak urrats bat gehiago eman du paradigma honetan, metodo matematiko konplexuagoekin errore-tarteak laburtuz eta datuen beharra murriztuz. Arlo hauetako informatikari askoren lana algoritmoa hautatzea, datuak biltzea eta “garbitzea” eta sistema ondo trebatzea da, algoritmoak garatzea baino.

Esan bezala emaitzak askotan ikusgarriak baina arazoak badaude. Alde batetik aipatutako errore-tartea dago, ataza batzuetan onargarria izan daitekeen bitartean, beste batzuetan onartezina da, Minority Report filmean irudikatutako atxiloketa prebentiboak [6] esaterako. Beraz, erabilpenarekin arreta handia jarri behar da, eta erabakia teknikoa baino etiko eta politikoa da. Aurpegien ezagutza masiboa da ezbaian dagoen erabilpen horietako bat [7]. Orokorrean sistema hauetan giza gainbegiratzea behar da, baina erabilpen okerrak ohikoak dira.

Baina, berezko duten errore-tarteaz gain, beste arazo bat dago eta aipatutako datuekin dago lotuta. Askotan datuetan alborapena (bias ingelesez) gertatzen dira, eta horrek sistemak lortuko dituen emaitzak baldintzatuko ditu. Aurreko artikulu batean, honetaz aritu ginen [8][9]jendartean dauden aurreiritziz kutsatuta daude makinak ere, hala nola arrazakeria eta sexismoa. Denbora luzez datuen kantitateari eman zaio garrantzia, baina gero eta argiagoa da kalitatea zaindu egin behar dela. Aipatu den datuen “garbiketa” gero eta funtsezkoagoa da, fase horretan saihestu behar direlako alborapenak.

Bi motako algoritmoak daude beraz, eta erroreak identifikatzeko eta zuzentzeko lana oso desberdina da. Informatikarien lana ere oso desberdina da algoritmo motaren arabera, eta bigarren motako lan-esparruari izen berriak jartzen ari zaizkio: adimen artifiziala eta datuen zientzia/ingeniaritza.

Algoritmoak, adimena eta akatsak

Sarean, han eta hemen argitaratzen direnak harrapatzen, zeure interesekoak direlakoan.