kitxua – Hizkuntza-teknologiak, Ixa Taldearen bloga https://www.unibertsitatea.net/blogak/ixa IXA taldea. Hizkuntzaren prozesamendua Wed, 31 May 2023 21:32:01 +0000 eu hourly 1 https://wordpress.org/?v=4.9.23 https://www.unibertsitatea.net/blogak/ixa/files/2018/10/ixa.jpg kitxua – Hizkuntza-teknologiak, Ixa Taldearen bloga https://www.unibertsitatea.net/blogak/ixa 32 32 Richard Castro kitxua-ingeniariaren bisita https://www.unibertsitatea.net/blogak/ixa/2014/11/14/richard-castro-kitxua-ingeniariaren-bisita/ https://www.unibertsitatea.net/blogak/ixa/2014/11/14/richard-castro-kitxua-ingeniariaren-bisita/#comments Fri, 14 Nov 2014 00:23:18 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=1647 20141113_171503Richard Castro Mamani ikertzaile Cuscoarra, Zuricheko Unibertsitatean hilebeteko egonaldia bukatu eta gero, gure fakultatetik pasa da egin dituzten azken urratsen berri emateko: 1)zuzentzaile ortografikoak  definitu dituzte Cuzcoko eta hegoaldeko kitxuarako, 2) normalizatzaile bat aldaera  horietatik “bitxua batu”ra pasatzeko, eta 3) espainieratik kitxuarako itzultzaile automatikoa.

Normalizatzailea funtsezko tresna izango da bildu dituzten corpusak modu bateratuan tratatu ahal izateko. Zorionak Richard-i eta Annette Rios-i aurtengo COLING-en argitaratu duten artikuluarengatik:

Morphological Disambiguation and Text Normalization for Southern Quechua Varieties. Annette Rios, Richard Castro.  Coling, pages 39-47, Dublin 2014

Badira hiru urte Peruko UNSAAC unibertsitateko Hinantin taldearekin lankidetzan ari garela. Aurten bertan bi produktu berri bukatu ditugu: Hugo Joel Quisperekin Kitxuaren Datu-Base Lexikala sortu dugu eta Rosemary Jimenezekin kitxuazko corpusa kontsultatzeko lehenengo web-aplikazioa.

Kitxuaren Datu-Base Lexikala kontsultatzeko interfazea (http://ixa2.si.ehu.es/qldbapp)

 

]]>
https://www.unibertsitatea.net/blogak/ixa/2014/11/14/richard-castro-kitxua-ingeniariaren-bisita/feed/ 1
Kitxua lantzeko, Cusco-ko bisitariak berriro gurean https://www.unibertsitatea.net/blogak/ixa/2013/12/05/kitxua-lantzeko-cusco-ko-bisitariak-berriro-gurean/ https://www.unibertsitatea.net/blogak/ixa/2013/12/05/kitxua-lantzeko-cusco-ko-bisitariak-berriro-gurean/#respond Thu, 05 Dec 2013 15:44:27 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=1315 HinantinPeruko UNSAAC unibertsitateko lankidetzan ari gara orain dela bi urtetik hona. Euskara automatikoki tratatzeko erabili dugun teknologia eta estrategia kitxua hizkuntzari ere aplikatzea da gure helburua.

Zuzentzaile ortografiko bat martxan dago. Analizatzaile morfologikoa eta sintaktiko xume bat ere bai. Hilabete gutxiren barruan kitxuaren datu-base lexikalaren lehen bertsioa eta corpusa kontsultatzeko lehenengo web-aplikazio bat plazaratu nahi ditugu.

Lehengo urtean bi bisitari izan genituen:

Aurten beste bi bisitari ditugu gure artean:

  • IMG_1758Rosemary Jimenez:  testuak automatikoki sailkatzeko programa aurkeztu du gaur bertan, bere master-tesi moduan. Eta bera da corpusa eratu eta kontsultatzeko aplikazioa sortzen ari dena.
  • José Lozano: Kitxua irakasteko sistema bat sortzen ari da Waldir Farfan-ekin. Datorren igandean kitxuazko esaldiak analizatzen dituen sistema aurkeztuko du Polonian, Language Technology Congress (LTC’2013) kongresuan.

2012an Madrileko Kooperaziorako Ministerioko proiektu bat izan genuen, 2013an EHUrekin RUNASIMI proiektua. Juan Cruz irakasleak koordinatzen duen Hinantin taldea jaio da. Orain proiektu berri bat prestatzen ari gara lan hauei 2014an jarraipena emateko.

]]>
https://www.unibertsitatea.net/blogak/ixa/2013/12/05/kitxua-lantzeko-cusco-ko-bisitariak-berriro-gurean/feed/ 0
Mintegia: Kitxuaren prozesamendurako lehen hurbilketa (2012/11/15) https://www.unibertsitatea.net/blogak/ixa/2012/11/12/mintegia-kitxuaren-prozesamendurako-lehen-hurbilketa/ https://www.unibertsitatea.net/blogak/ixa/2012/11/12/mintegia-kitxuaren-prozesamendurako-lehen-hurbilketa/#comments Mon, 12 Nov 2012 14:55:31 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=759 Bada ia urtebete Ixa Taldea ea Cuscoko UNSAAC unibertsitateko Juan Cruz ikertzailearen artean kitxuaren prozesamenduari ekiteko lanean hasi ginela.  Euskara eta kitxua  biak baliabide gutxiko hizkuntzak direnez eta morfologia antzekoa dutenez, euskara normalizatzeko eta bere erabilera errazteko azken 20 urtetan hemen egin ditugun tresnak eta aplikazioak baliagarri izan daitezke kitxuaren kasuan ere. Madrileko “Ministerio de Asuntos exteriores y Cooperación”-en proiektu bat izan dugu 2012 urtean: Lehen urratsak Quechua-ren prozesaketa automatikoan. Corpus, morfologia eta lexikoa. Proiektu horren barruan Kepa, Xabier eta Olatz Cuscon egon gara urtean zehar, eta irailetik hona bisitan dauzkagu Hugo Quispe  eta Richard Castro. Hugo datu base lexikal bat garatzen ari da kitxuarako, eta Richard hizketa sortzeko beste sistema bat eraiki du Bilboko Aholab laborategian. Richard-ek datorren astean Iberspeech2012 kongresuan demo bat aurkeztuko du hizketa sortzeko eginda zeukaten beren lehen sistemarekin. Osteguneko mintegi-saioan proiektu honen barruan egin dena azalduko dugu.

Richard eta Hugo Aholab laborategian

Gaia: Kitxuaren prozesamendurako lehen hurbilketa
(Primera aproximación al procesamiento automático del Quechua)
Hizlaria: Hugo Quispe, Richard Castro (UNSAAC unibertsitatea),
Olatz Arregi,  Xabier Artola eta  Kepa Sarasola (Ixa Taldea)
Eguna: azaroaren 15ean, osteguna
Ordua: 16:00-17:00
Tokia:  3.2 aretoa. Informatika Fakultatea


Laburpena:
El Quechua o “Runasimipi” como lengua oriunda de la cultura Inca en el Perú, es una familia de lenguas en Latinoamérica. La situación actual de la lengua, por factores como la occidentalización entre otros, ha hecho que el quechua sea una lengua vulnerable, en vías de extinción.

Un grupo de profesores e investigadores del grupo IXA de la UPV/EHU, en conjunto con la UNSAAC en Cusco, Perú, estamos realizando un trabajo para sentar las bases de lo que pretende ser el centro de ingeniería lingüística de Cusco. Se trata de desarrollar los primeros recursos básicos y herramientas para al procesamiento automático del quechua. Los temas en los que estamos trabajando son: recopilación de un corpus textual, una base de datos léxica para la lengua quechua (BDLQ) y futuras herramientas derivadas de la misma, uso de la herramienta FOMA en el análisis morfológico y creación de un TTS como herramientas básicas para el tratamiento de la lengua.

De esta manera, se ha consolidado las bases de apoyo y trabajo en equipo entre las dos universidades, en bien de una lengua en situación crítica.

Cuscoko taldea 2012ko urtarrilean
]]>
https://www.unibertsitatea.net/blogak/ixa/2012/11/12/mintegia-kitxuaren-prozesamendurako-lehen-hurbilketa/feed/ 4