SEPLN – Hizkuntza-teknologiak, Ixa Taldearen bloga https://www.unibertsitatea.net/blogak/ixa IXA taldea. Hizkuntzaren prozesamendua Wed, 31 May 2023 21:32:01 +0000 eu hourly 1 https://wordpress.org/?v=4.9.23 https://www.unibertsitatea.net/blogak/ixa/files/2018/10/ixa.jpg SEPLN – Hizkuntza-teknologiak, Ixa Taldearen bloga https://www.unibertsitatea.net/blogak/ixa 32 32 Twitter-eko testuak normalizatzeko lehiaketa antolatu dugu. https://www.unibertsitatea.net/blogak/ixa/2013/09/02/twitter-eko-testuak-normalizatzeko-lehiaketa-antolatu-dugu/ https://www.unibertsitatea.net/blogak/ixa/2013/09/02/twitter-eko-testuak-normalizatzeko-lehiaketa-antolatu-dugu/#respond Mon, 02 Sep 2013 12:39:41 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=1157 Twitter-eko testuetan hitzak ez dira azaltzen beti beren itxura normalizatuan.  Laburtuta azaltzen dira sarritan, edo deformatuta emozio-puntu bat adierazteko (edeeeerra, esaterako). Normalizazio-falta hori arazo da Twitterreko testuak gero automatikoki landu ahal izateko hizkuntza-teknologikaren bidez.

Ixa taldeko kide batzuen iniziatibaz Tweet Normalization Workshopa  antolatu da aurten SEPLN2013 konferentziaren barruan.

Tweet-NormWEET-NORM_2013 Workshop hori lehiaketa baten inguruan antolatu da, partaideek lehenago espaineraz idatzitako “txioak” normalizatu behar izan dituzte, eta honezkero publikoak dira lehiaketaren emaitzak (ikusi behean ere). Euskal Herriko parte hartzaileak ez gara txarto geratu. Elhuyar, IXA Taldea eta Vicomtech hor gaude hirurak elkarren jarraian 4., 5. eta 6. posizioetan.

Workshopa irailaren 20an izango da Madrilen. Talde bakoitzak bere sistema aurkeztuko du eta bukaeran eztabaida egingo dugu.

Posizioa Parte hartzailea
Exekuzio hoberenaren zehaztasuna
2. Exekuzio Hoberenaren  zehaztasuna
1 RAE 0,781
2 Citius-Imaxin 0,663 0,662
3 UPC 0,653
4 Elhuyar 0,636 0,634
5 IXA-EHU_em-phonm 0,619 0,609
6 Vicomtech 0,606
7 UniArizona 0,604
8 UPF-Havas 0,548 0,491
9 DLSIAlicante 0,545 0,521
10 UniMelbourne 0,539 0,517
11 UniSevilla 0,396
12 Ujaen-sinai 0,376
13 UniCoruña 0,335

Ixa taldean workshop hau TACARDI proiektuaren barruan bideratzen dugu. Itzulpen automatikoari ekin aurretik testuak zuzentzea eta normalizatzea oso lagungarria izaten baita.

Tacardi_irudia
TACARDI proiektua: Testuinguruaren erabilera itzulpen automatikoan eta horren hobekuntza Interneteko baliabide dinamikoak baliatuz

]]> https://www.unibertsitatea.net/blogak/ixa/2013/09/02/twitter-eko-testuak-normalizatzeko-lehiaketa-antolatu-dugu/feed/ 0