sintaxi – Hizkuntza-teknologiak, Ixa Taldearen bloga https://www.unibertsitatea.net/blogak/ixa IXA taldea. Hizkuntzaren prozesamendua Wed, 31 May 2023 21:32:01 +0000 eu hourly 1 https://wordpress.org/?v=4.9.23 https://www.unibertsitatea.net/blogak/ixa/files/2018/10/ixa.jpg sintaxi – Hizkuntza-teknologiak, Ixa Taldearen bloga https://www.unibertsitatea.net/blogak/ixa 32 32 Itziar Gonzalez-Dios hizkuntzalari konputazionala (Zientzia Kaiera) https://www.unibertsitatea.net/blogak/ixa/2020/04/23/itziar-gonzalez-dios-hizkuntzalari-konputazionala-zientzia-kaiera/ https://www.unibertsitatea.net/blogak/ixa/2020/04/23/itziar-gonzalez-dios-hizkuntzalari-konputazionala-zientzia-kaiera/#respond Thu, 23 Apr 2020 07:34:06 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=2803

Unibertsitateko Ikerlarien lanak dibulgatzen dituen Zientzia Kaiera guneak Itziar Gonzalez-Dios ixakidean jarri zuen arreta pasa den martxoan.

“Hibridoa naiz (eta harro nago)” dio Itziarrek bere buruaz. KonItziar Gonzalez-Diostrako jo ohi diren bi mundu batzen ditu bere jardunean: hizkuntzalaritza (Letrak) eta informatika (Zientziak). Aleman Filologian 2011n lizentziatu ondoren, Hizkuntza Prozesamenduan Masterra masterra egin zuen 2012an. Hibrido bat dela aitortzen du artikuluan, umoretsu: “Hala deitzen diogu gure buruari Ixa taldeko kideok”.

Eneko Bidegain eta Itziar (CC-BY-SA, UEU))

2016an aurkeztu zuen bere tesia:  euskarazko testu konplexuak automatikoki sinplifikatzeko proposamen bat. Hitz arraroak edo egitura sintaktiko luze eta zailak automatikoki ulergarriago bihurtzea da bere ikerketaren helburua. 2014an #Txiotesia2 lehiaketa irabazi zuen bere tesi-lana 6 txiotan kontatuta.

Egun, Bilboko Ingeniaritza eskolako Euskal Hizkuntza eta Komunikazioa sailean ari da. Geroztik, irakaskuntzan eta ikerketan dabil.

Elhuyarreko Ana Galarraga  izan da Kaierako artikuluaren egilea.

]]>
https://www.unibertsitatea.net/blogak/ixa/2020/04/23/itziar-gonzalez-dios-hizkuntzalari-konputazionala-zientzia-kaiera/feed/ 0
Euskararen sintaxi konputazionala (Maria Jesus Aranzabe, Kultura Zientifikoa) https://www.unibertsitatea.net/blogak/ixa/2019/06/30/2753/ https://www.unibertsitatea.net/blogak/ixa/2019/06/30/2753/#respond Sun, 30 Jun 2019 09:21:35 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=2753 UPV/EHUko “Kultura Zientifikoa” Katedrak gure ikertaldeko kidea den Maria Jesus Arantzaberekin bideo bat grabatu du Hizkuntza-teknologiaz eta sintaxi konputazionalaz.

Hau da bideo-albistea: “Hizkuntza-teknologiak ezinbesteko tresna dira euskara bultzatu nahi baldin badugu

Sintaxiak esaldiaren egitura zein den eta esaldi horretako elementuak nola eta zein hurrenkeran azaldu diren aztertzen ditu.
Sintaxia funtsezkoa da morfologiaz harantzago joan nahi duten aplikazio eta tresnak garatzeko: dokumentu-bilatzaileak, galdera-erantzunen sistemak, itzulpen automatikoa, testuen sinplifikazioa, testuen laburpena eta abar.

Zuhaitz-bankuak sintaktikoki etiketatutako corpusak dira.
Dependentzia sintaktikoak hizkuntza guztietan modu berean etiketatu nahi dira dependentzia   unibertsalen bitartez. Euskaraz ere lortu dugu hori.

Gaiari buruz gehiago jakin nahi duenarentzat, master bat hasiko da urrian: Hizkuntzaren Azterketa eta Prozesamendua

]]>
https://www.unibertsitatea.net/blogak/ixa/2019/06/30/2753/feed/ 0
Mintegia: Zuhaitz-banku unibertsala (K.Gojenola, 2015/10/20) https://www.unibertsitatea.net/blogak/ixa/2015/10/20/mintegia-zuhaitz-banku-unibertsala-k-gojenola-20151020/ https://www.unibertsitatea.net/blogak/ixa/2015/10/20/mintegia-zuhaitz-banku-unibertsala-k-gojenola-20151020/#comments Tue, 20 Oct 2015 07:43:48 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=1886

Hizlaria:  Koldo Gojenola
Ordua: 15:00-16:00
Gela: 3.2 gela. Informatika Fakultatea (UPV/EHU)
Izenburua:  “Zuhaitz-banku unibertsala / Universal Treebank

2008. urtetik hona, hizkuntza desberdinetan garatutako zuhaitz-bankuek etiketatze eredu estandarra jarraitzeko hainbat saiakera egin dira (Standford Dependencies, Clear, Google UD, Standford UD, Hamlet). 2014tik aurrera Standford UDetan oinarritutako Universal Dependencies, “de facto”zko estandarra bihurtu da. Gure zuhaitz-bankua UDetara bihurtzen hasi gara, eta lehenengo bertsio bat atzigarri dago jada. Eman diren urratsak eta egoera azalduko ditugu mintegi honetan.

]]>
https://www.unibertsitatea.net/blogak/ixa/2015/10/20/mintegia-zuhaitz-banku-unibertsala-k-gojenola-20151020/feed/ 1
Hitzaldia: Dependentziazko analizatzaileen erroetarantz (Miguel Ballesteros, 2014-12-16) https://www.unibertsitatea.net/blogak/ixa/2014/12/16/hitzaldia-dependentziazko-analizatzaileen-erroetarantz-miguel-ballesteros-2014-12-16/ https://www.unibertsitatea.net/blogak/ixa/2014/12/16/hitzaldia-dependentziazko-analizatzaileen-erroetarantz-miguel-ballesteros-2014-12-16/#respond Mon, 15 Dec 2014 23:38:48 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=1714

Hizlaria:  Miguel Ballesteros (Universitat Pompeu Fabra)
Eguna:
Abenduaren 16an, asteartea
Ordua: 15:30-16:30
Tokia: 3.2 gela. Informatika Fakultatea
Izenburua: “Going to the Roots of Dependency Parsing  / Dependentziazko analizatzaileen erroetarantz ”

]]>
https://www.unibertsitatea.net/blogak/ixa/2014/12/16/hitzaldia-dependentziazko-analizatzaileen-erroetarantz-miguel-ballesteros-2014-12-16/feed/ 0
Tesia: Estaldura zabaleko euskararako analizatzaile sintaktiko estatistikoa (Kepa Bengoetxea, 2014-12-16) https://www.unibertsitatea.net/blogak/ixa/2014/12/16/tesia-estaldura-zabaleko-euskararako-analizatzaile-sintaktiko-estatistikoa-kepa-bengoetxea-2014-12-16/ https://www.unibertsitatea.net/blogak/ixa/2014/12/16/tesia-estaldura-zabaleko-euskararako-analizatzaile-sintaktiko-estatistikoa-kepa-bengoetxea-2014-12-16/#respond Mon, 15 Dec 2014 23:27:45 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=1710 Tesiaren titulua: Estaldura zabaleko euskararako analizatzaile sintaktiko estatistikoa
Non
: Informatika Fakultateko Gradu Aretoan
Eguna: Abenduak 16, asteartea
Ordua: 11:00etan
Egilea: Kepa Bengoetxea Kortazar
Zuzendaria: Koldo Gojenola Galletebeitia

Agindu bezala hemen dator Kepa Bengoetxea Kortazar ixakideak asteartean defendatuko duen tesia. Sintaxi konputazionalari buruz aurten aurkeztuko den hirugarren tesia da hau, estaldura zabaleko analizatzaile estatitiskoa dakarrena, Maltixa izenekoa.

EU_SintaxiKonp_Mugarriak
Mugarriak euskarararen sintaxi konputazionalean
]]>
https://www.unibertsitatea.net/blogak/ixa/2014/12/16/tesia-estaldura-zabaleko-euskararako-analizatzaile-sintaktiko-estatistikoa-kepa-bengoetxea-2014-12-16/feed/ 0
Hitzaldia: SVMren erabilera egitura sintaktikoak deskubritzeko (Toni Martí, 2014/12/15) https://www.unibertsitatea.net/blogak/ixa/2014/12/14/hitzaldia-svmren-erabilera-egitura-sintaktikoak-deskubritzeko-toni-marti-20141215/ https://www.unibertsitatea.net/blogak/ixa/2014/12/14/hitzaldia-svmren-erabilera-egitura-sintaktikoak-deskubritzeko-toni-marti-20141215/#comments Sun, 14 Dec 2014 12:16:37 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=1707 Hizlaria:Toni Martí, (Universitat de Barcelona, Hizkuntzalaritza orokorra)
Eguna: abenduaren 15ean, 2014, astelehena
Ordua: 11:00 – 12:30
Non
: Informatika Fakutatea, 3.2 gela
Izenburua: “SVMren erabilera egitura sintaktikoak deskubritzeko / A Vector Space Model approach to discover constructions”

 

]]>
https://www.unibertsitatea.net/blogak/ixa/2014/12/14/hitzaldia-svmren-erabilera-egitura-sintaktikoak-deskubritzeko-toni-marti-20141215/feed/ 1
Argitalpena: Sistema itzultzaile hibridoa sintaxiak gidaturikoa https://www.unibertsitatea.net/blogak/ixa/2014/09/23/argitalpena-sistema-itzultzaile-hibridoa-sintaxiak-gidataturikoa/ https://www.unibertsitatea.net/blogak/ixa/2014/09/23/argitalpena-sistema-itzultzaile-hibridoa-sintaxiak-gidataturikoa/#comments Tue, 23 Sep 2014 15:48:33 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=1595 A hybrid machine translation architecture guided by syntax
Horixe da Springer argitaletxeko Machine Translation Journal aldizkariak argitaratu berri duen gure artikulu baten izenburua.MTJournal_SMatxinTIxa taldea eta Bartzelonako TALP zentroa lankidetzan ibili ginen OpenMT-2 proiektuan 2009-2012 urteetan. Eta artikulu hau da proiektuko horren azken emaitza.

Espainieratik euskarara itzultzen duten bi sistema oso diferente elkarrekin lanean jartzea izan da gure helburua. Itzultzaile automatiko horietako bat estatistikoa da (EUSMT), bestea erregeletan oinarritutakoa (Matxin). Biak batzen dituen sistema hibridoak hasieran esaldien analisi sintaktikoa egiten du, erregeletan oinarritutako sistemak egiten duen bezala, baina gero egitura sintaktikoaren osagai bakoitza modu batera eta bestera saiatzen da itzultzen. Bukaeran prozedura estatistiko bat erabiltzen du itzulpen posible guztien artean hoberena hautatzeko.

SMatxinT_arkitektura

Itzultzaileen ebaluazioa neurri automatikoekin egin dugunean sistema hibridoa izan da onena, argi eta garbi. Hortaz, arrakastatsua izan da gure proiektua.

Baina eskuzko ebaluazioa egin dugunean gizakiek Matxinen itzulpenak nahiago izan dituzte sistema estatistikoarenak edo hibridoarenak baino. Hor, beraz, itzulpengintza automatikoan dagoen konpondugabeko arazo batekin egin dugu topo: ebaluaziorako neurri estatistikoak eta giza-ebaluatzaileak beti ez dira bat etortzen. Ebaluazio automatikoa merkea da, baina ez guztiz sinesgarria, eta maiz erabiltzen da ikerketan 🙁   Giza-ebaluatzaileen iritziekin bat etorriko diren neurri automatiko hobeak asmatzeko daude!

Ederra lankidetza TALP zentrokoekin izan duguna (). Orain Tacardi proiektuan gabiltza elkarrekin.

]]>
https://www.unibertsitatea.net/blogak/ixa/2014/09/23/argitalpena-sistema-itzultzaile-hibridoa-sintaxiak-gidataturikoa/feed/ 1
Tesia: EPEC corpusa predikatu-mailan etiketatzeko oinarriak (2014/09/04) https://www.unibertsitatea.net/blogak/ixa/2014/09/02/tesia-epec-corpusa-predikatu-mailan-etiketatzeko-oinarriak-20140904/ https://www.unibertsitatea.net/blogak/ixa/2014/09/02/tesia-epec-corpusa-predikatu-mailan-etiketatzeko-oinarriak-20140904/#respond Tue, 02 Sep 2014 13:07:54 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=1564 Tesiaren titulua:  EPEC corpusa predikatu-mailan etiketatzeko oinarriak: EPEC-RolSem, BVI eta e-ROLda
Non
: Informatika Fakultatean,
Eguna: irailak 4,
Ordua: 10:30ean (11:30etan ez)

Agindu bezala hemen dator Ainara Estarrona Ibarzola ixakideak ostegunean defendatuko duen tesia. Sintaktikoki etiketatuta dagoen EPEC corpusean predikatu-mailan etiketatu ahal izateko hiru baliabide berri sortu dira tesi honetan:

  • EPEC-RolSem corpusa, EPEC bezelakoa baina predikatu mailan ere etiketatua
  • BVI:  Euskarazko aditzen lexikoia (Basque Verb Index)
  • e-ROLda:  BVI  eta EPEC-RolSem kontsultatzeko tresna
EU_SintaxiKonp_Mugarriak
Mugarriak euskarararen sintaxi konputazionalean

 

 

]]>
https://www.unibertsitatea.net/blogak/ixa/2014/09/02/tesia-epec-corpusa-predikatu-mailan-etiketatzeko-oinarriak-20140904/feed/ 0
Kitxua lantzeko, Cusco-ko bisitariak berriro gurean https://www.unibertsitatea.net/blogak/ixa/2013/12/05/kitxua-lantzeko-cusco-ko-bisitariak-berriro-gurean/ https://www.unibertsitatea.net/blogak/ixa/2013/12/05/kitxua-lantzeko-cusco-ko-bisitariak-berriro-gurean/#respond Thu, 05 Dec 2013 15:44:27 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=1315 HinantinPeruko UNSAAC unibertsitateko lankidetzan ari gara orain dela bi urtetik hona. Euskara automatikoki tratatzeko erabili dugun teknologia eta estrategia kitxua hizkuntzari ere aplikatzea da gure helburua.

Zuzentzaile ortografiko bat martxan dago. Analizatzaile morfologikoa eta sintaktiko xume bat ere bai. Hilabete gutxiren barruan kitxuaren datu-base lexikalaren lehen bertsioa eta corpusa kontsultatzeko lehenengo web-aplikazio bat plazaratu nahi ditugu.

Lehengo urtean bi bisitari izan genituen:

Aurten beste bi bisitari ditugu gure artean:

  • IMG_1758Rosemary Jimenez:  testuak automatikoki sailkatzeko programa aurkeztu du gaur bertan, bere master-tesi moduan. Eta bera da corpusa eratu eta kontsultatzeko aplikazioa sortzen ari dena.
  • José Lozano: Kitxua irakasteko sistema bat sortzen ari da Waldir Farfan-ekin. Datorren igandean kitxuazko esaldiak analizatzen dituen sistema aurkeztuko du Polonian, Language Technology Congress (LTC’2013) kongresuan.

2012an Madrileko Kooperaziorako Ministerioko proiektu bat izan genuen, 2013an EHUrekin RUNASIMI proiektua. Juan Cruz irakasleak koordinatzen duen Hinantin taldea jaio da. Orain proiektu berri bat prestatzen ari gara lan hauei 2014an jarraipena emateko.

]]>
https://www.unibertsitatea.net/blogak/ixa/2013/12/05/kitxua-lantzeko-cusco-ko-bisitariak-berriro-gurean/feed/ 0
Hizkuntzalari Euskaldunen I. Topaketa https://www.unibertsitatea.net/blogak/ixa/2013/07/06/1122/ https://www.unibertsitatea.net/blogak/ixa/2013/07/06/1122/#respond Sat, 06 Jul 2013 10:20:30 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=1122
Programa

Arrakastatsua izan da Hizkuntzalari Euskaldunen I. Topaketa. UEUko Hizkuntzalaritza Sailburuak diren Itziar Aduriz eta Ruben Urizar IXAkideek balorazio oso positiboa egin dute bilkuraz.

Lau izan dira bilkuran Ixa Taldearen aldetik aurkeztu diren lanak:

  • Euskarazko testuen sinplifikazio automatikoa. Itziar Gonzalez Dios
  • EPEC corpusa predikatu mailan etiketatzeko eta ustiatzeko oinarriak: BVI, EPEC-RoISem eta e-ROLda. Ainara Estarrona
  • Ezagutza linguistikoa Ingelesa-Euskara itzulpen automatikoko sistemen garapenean. Nora Aranberri
  • BASYQUE: hizkeren arteko aldakortasun sintaktikoa aztertzeko aplikazioa. Gotzon Santander, Xan Aire, Larraitz uria eta Ricardo Etxepare (CNSR-IKER / UPV-EHU, IXA)

Zorionak, hizkuntzalariok!

Albistea UEU365 blogean
Edurne Elizondoren albistea Berrian
(Arg.: A. Canellada, ARP)
]]>
https://www.unibertsitatea.net/blogak/ixa/2013/07/06/1122/feed/ 0