Txapelketaren helburua gaztelaniazko Twitter mezuetan jarrera positiboa edo negatiboa antzematea zen. Formalki horri sentimenduen analisia esaten zaio (análisis de sentimientos, sentiment analysis edo opinion mining)
Eta nor izan da txapelduna? Elhuyar I+G !
Sistemaren garatzaileak Iñaki San Vicente eta Xabier Saralegi izan dira (gure HAP master ofizialean hezitako jendea).
ZORIONAK!
Emaitza guztiak hemen ikus daitezke.
]]>
Programaren erabilera guztiz hedatuta dago gaur egun, erabiltzaile kopuruaren aldetik eta aplikazio informatikoen aldetik:
1) Dohainik jaitsi daiteke www.euskara.euskadi.net webgunetik,
2) 1998z geroztik Microsoft Officeko banaketa ofizial guztiek barruan daukate.
3) www.euskara.euskadi.net webgunetik egin diren deskargak 20.000 baino gehiago izan dira.
4) OpenOffice-rako deskargak 7.000 baino gehiago izan ziren 2010. urtean.
5) Firefoxerako deskargak 134.000 baino gehiago izan dira 2007tik.
6) Eta posible da beste edozein aplikaziorekin ere erabiltzea www.xuxen.com zerbitzarira jotzen badugu.
Baina espainiera, frantsesa edo ingeleserako zuzentzaileak baino dezente konplexuagoa da XUXEN, hitz posibleak askoz gehiago direlako, eta ondorioz, hitzen analisi morfologikoa egin behar delako. 1989an horretarako balio zuen programa propio eta konplexu bat sortu behar izan genuen. Baina hori ez zatekeen posible izan sei urte lehenago Kimmo Koskeniemmi irakasle finlandiarrak Two Level Morphology metodologia asmatu izan ez balu. Finlandieraren morfologia lantzeko asmatu zuen Koskeniemmik metodo hori, baina laster frogatu zen euskararako, ingeleserako eta beste hainbat hizkuntzatarako ere balio zuela. Geroago, urteak pasata birritan birprogramatu behar izan dugu gure zuzentzailea Karttunen, Beesley (www.fsmbook.com) eta Mans Hulden (code.google.com/p/foma) ikertzaileek asmatutako teknika berriak aplikatzeko.
Kimmo Koskeniemmi Donostiara ekarri genuen hitzaldi bat ematera 1991ean, eta berriro etorriko da datorren astean antolatu dugun nazioarteko biltzar batera: 10th edition of the International Workshop on Finite State Methods and Natural Language Processing 2012 – FSMNLP 2012.
Hori aprobetxatuz, eta jakinda irailean jubilatuko dela, pertsonalki eskertuko ahal izango diogu omenalditxo batekin morfologia konputazionalean egin zuen ekarpena, hain zuzen, euskararen prozesamendu automatikorako hain garrantzitsua izan zaiguna. ESKERRIK ASKO KIMMO!
Atal bakoitzean nabaritu dena aipatzen dute eta Elhuyarrekoek eurek kongresuan aurkeztu duten AzerHitz proiektuko ikerketaren azken emaitzak ere azaltzen dituzte. AzerHitz terminologia-erauzketaren alorrean kokatzen da. Corpus konparagarrietatik lexiko elebiduna erauzteko teknikak lantzen dira ikerketa horretan, metodo probabilistikoak bektoreetan eta horien arteko distantzietan oinarritutako metodoekin alderatuz. Metodo probabilistikoek hobekuntza bat ekarri omen diete aurreko lanarekin alderatuta (aurtengo LREC-2008 kongresuan aurkeztu dutena).
SEPLN-2009 Donostian izango da, eta XXV. saioa izango da . Honezgero hasi gara Ixa taldean antolaketarekin. Bai, noski, eurek dioten bezala guk ere espero dugu Elhuyar han izango dela.
Eta ongi etorria beren blogari. Hizkuntza-teknologiako berriak dakartzala eta, gure blogeko esteken artean sartu dugu.
]]>