Hitzaldia – Hizkuntza-teknologiak, Ixa Taldearen bloga https://www.unibertsitatea.net/blogak/ixa IXA taldea. Hizkuntzaren prozesamendua Wed, 31 May 2023 21:32:01 +0000 eu hourly 1 https://wordpress.org/?v=4.9.23 https://www.unibertsitatea.net/blogak/ixa/files/2018/10/ixa.jpg Hitzaldia – Hizkuntza-teknologiak, Ixa Taldearen bloga https://www.unibertsitatea.net/blogak/ixa 32 32 Alfonso Ureña, Hizkuntzaren ekonomia berriko jardunaldian (2022-06-01) https://www.unibertsitatea.net/blogak/ixa/2022/06/01/alfonso-urena-hizkuntzaren-ekonomia-berriko-jardunaldian-2022-06-01/ https://www.unibertsitatea.net/blogak/ixa/2022/06/01/alfonso-urena-hizkuntzaren-ekonomia-berriko-jardunaldian-2022-06-01/#respond Wed, 01 Jun 2022 10:29:04 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=3098
Alfonso Ureña, SEPLN elkarteko presidentea.

Hizkuntzaren ekonomia berriko trantsizio digital eleaniztunari buruzko jardunaldia antolatu dugu Donostiako Miramar jauregian. Galdera hauei erantzuteko asmoz:

  • Nola egin arrakastaz trantsizio digital eleaniztuna; nola bermatu gure hizkuntzen eta kulturen iraupen digitala?
  • Nola bihurtu sozioekonomikoki errentagarri eleaniztasuna: berrikuntza, zerbitzuak, produktuak eta negozio-eredu berriak?

SEPLN Hizkuntza Naturala Prozesatzeko Espainiako Elkarteak, Eusko Jaurlaritzako Kultura Sailaren eta UPV/EHUko HiTZ zentroaren lartean antolatu dugu.

SEPLN Hizkuntza Naturala Prozesatzeko Espainiako Elkarteko Presidente Alfonso Ureñaren hasierako hitzak hauek izan dira:

Eva Ferreira, Bingen Zupiria, eta Allfonso Ureña. (arg.: Langune)

Eskerrak eman nahi dizkiet Eusko Jaurlaritzari, Kultura Sailari eta Euskal Herriko Unibertsitateko HiTZ zentroari. Bereziki, Eneko Agirre HiTZ zentroko zuzendariari, Eva Ferreira errektoreari eta Bingen Zupiria sailburuari. Eta eskerrak eman nahi dizkiegu hizkuntzaren ekonomia berriko trantsizio digital eleaniztunari buruzko jardunaldi honetan parte hartzen duten guztiei.

Hizkuntzaren teknologiaren potentzialtasunari erantzuna eman eta ezagutarazteko helburua du jardunaldi honek. Adimen artifizialaren iraultza gertatzen ari da, oro har, eta, bereziki, hizkuntza naturalaren prozesamenduarena. Gizarteko esparru eta sektore gehienetan sartzen ari da.

Utz iezadazu aipamen labur bat egiten  Hizkuntza Naturalaren Prozesamendurako Espainiako Elkartea (SEPLN) aurkezteko. Espainian ikerketa egituratzen duen elkartea. Ibilbide luzea du, 1983tik. Oso komunitate aktiboa da, irabazi asmorik gabekoa eta bazkide numerarioek, erakundeek eta enpresek osatua. Horren helburua da hizkuntza naturalaren prozesamenduaren esparruan ikerketari, irakaskuntzari edo prestakuntzari eta garapenari buruzko era guztietako jarduerak sustatu eta zabaltzea, bai nazio mailan, bai nazioartean. Azpimarratu behar da SEPLN kongresua Espainiako zaharrena dela informatikaren arloan, eta urtero egiten dela, etenik gabe, 1983an sortu zenetik, Donostian hain zuzen ere. Gizarteak giza kapital handia du, masa kritiko garrantzitsua, izen handiko ikertzaileak eta ikerketa-talde garrantzitsu eta nazioartekotuak biltzen baititu. Talde horiek Hizkuntzaren Teknologiako komunitate ia osoa osatzen dute, ez bakarrik Espainian, baita Iberoamerikako erreferentea ere bada.

Jardunaldiaren xedeari dagokionez, hizkuntza naturala harrigarria dela aipatu nahiko nuke. Ahalegin handiik gabe, ezezagun bati galde diezaiokegu nola aurkitu kafetegi bat edo hurbilago bazkaltzeko toki bat. Gure esperientziak, ezagutzak eta abar partekatu ditzakegu. Hizkuntza da informazioa transmititu eta atzitzeko modurik arruntena eta praktikoena. Hizkuntza erabiltzen dugu, gure komunikazio-ingurune naturala den aldetik, informazioa kodetzeko, gordetzeko, transmititzeko, partekatzeko eta manipulatzeko. Hain zuzen, eskura dagoen informazio digital gehiena egituratu gabeko informazioa da, dokumentu gisa hainbat hizkuntzatan (idatziak edo hitz egindakoak), eta hori erronka bat da informazio hori ustiatu eta prozesatu nahi duen edozein erakunderentzat. Izan ere, ez da erraza egituratu gabeko informazio digitala (testua eta ahotsa) prozesatzea, hainbat interpretazio baititu (anbiguotasuna), testuinguruari eta munduari buruzko ezagutzarik eza eta bere berezko konplexutasuna. Hizkuntzaren Teknologiak (TL), giza hizkuntza prozesatzeko gai diren sistemak aztertu eta garatzeaz arduratzen denak, hainbat metodo garatu ditu urteen bidez testuetako informazioa esplizitu egiteko eta deskribatzen duen errealitatearekin lotzeko.

Beraz, hizkuntza adimen artifiziala garatzeko gure ahaleginen erdigunean egon behar da, eta alderantziz. Izan ere, gaur egun, Hizkuntzaren Teknologia da, seguruenik, adimen artifizialaren eremurik berritzaileena, hazkunde azkarreko eragin ekonomikoa duena. Gaur egun, duela urte batzuk aurrerapen ikaragarriak eta imajinaezinak gertatzen ari dira. Hain zuzen, NLP aplikazio funtzionaleko eremu garrantzitsuenetako bat da. Adimen artifizialaren %50 baino gehiago Hizkuntzaren Prozesamendua dela kalkulatzen da.

Egiten diren lan askoren berezko zailtasuna gorabehera, Hizkuntza-teknologiaren egungo garapen-mailak duela urte gutxi pentsaezinak ziren aplikazio aurreratu asko ahalbidetzen ditu. Hizkuntza-Teknologia gure eguneroko bizitzan dago, nahiz eta ez garen horretaz jabetzen. Adibidez, informazio-bilatzaileen, gomendio-sistemen, laguntzaile birtualen, txat-en, testu-zuzentzaileen, testu-aurresaleen, itzulpen automatikoko sistemen, azpititulazio automatikoen, laburpen automatikoen, teknologia inklusiboaren eta abarren bidez. baita administrazioan ere, aplikazio-eremu bertikalen bidez, hala nola hezkuntza, osasuna, justizia, turismoa… Azken urteetan izan duen garapen azkarrak emaitza are harrigarriagoak ekarri ditu etorkizun hurbilean.

 

 

“Buenos días a todos y bienvenidos a la jornada sobre la transición digital multilingüe en l nueva economía de la lengua.

Quisiera agradecer el apoyo del Gobierno Vasco, concretamente a la Consejería de Cultura y al centro HiTZ de la Universidad del País Vasco. Especialmente, al  director del centro HiTZ Eneko Agirre, a la rectora Eva Ferreira y al consejero Bingen Zupiria.

Y agradecer a todos los que participan y asisten en esta jornada sobre la transición digital multilingüe en la nueva economía de la lengua.

Esta jornada se enmarca con el objetivo de dar respuesta y dar a conocer la potencialidad de la tecnología del lenguaje. Estamos asistiendo a una revolución de la inteligencia artificial en general y en particular del procesamiento del lenguaje natural, también conocido como tecnología del lenguaje que está penetrando en todos los ámbitos y en la mayor parte de los sectores de la sociedad. 

Permítanme que haga una breve reseña y presentación a la Sociedad Española para el Procesamiento para el Lenguaje Natural (SEPLN). La sociedad que viene vertebrando la investigación en España. Cuenta con una larga trayectoria, desde 1983. Es una comunidad  muy activa, sin ánimo de lucro y formada por socios numerarios, instituciones y empresas. Cuyo objetivo es promover y difundir todo tipo de actividades referentes a la investigación, a la enseñanza o formación y desarrollo en el ámbito del procesamiento del lenguaje natural, tanto a nivel nacional como internacional. Resaltar que el congreso SEPLN es el más antiguo de España en el ámbito de la informática, viene realizándose año tras año, de manera ininterrumpida, desde la fecha de creación en 1983, precisamente en esta ciudad de San Sebastián. La sociedad cuenta con un gran capital humano, una masa crítica importante, ya que agrupa a investigadores de alto prestigio y grupos de investigación muy relevantes e internacionalizados que constituyen prácticamente toda la comunidad en Tecnología del Lenguaje, no sólo en España, también es un referente en Iberoamérica.

Centrándonos en el objeto de la jornada, quisiera mencionar que el lenguaje  natural es asombroso. Sin esfuerzo podemos preguntar a un desconocido cómo encontrar una cafetería o un lugar para comer más cercano. Podemos compartir nuestras experiencias, conocimientos, etc. El lenguaje es la forma más común y versátil para transmitir y acceder a la información. Usamos el lenguaje, como nuestro medio natural de comunicación, para codificar, almacenar, transmitir, compartir y manipular información. De hecho, la mayor parte de la información digital disponible es información no estructurada en forma de documentos (escritos o hablados) en múltiples idiomas, lo que representa un desafío para cualquier organización que quiera explotar y procesar esta información. Ya que no es trivial procesar la información digital no estructurada (texto y voz), ya que está sujeta a múltiples interpretaciones (ambigüedad), falta de conocimiento sobre el contexto y el mundo, y su complejidad intrínseca. La Tecnología del Lenguaje (TL) que se ocupa de estudiar y desarrollar sistemas capaces de procesar lenguaje humano, ha desarrollado a través de los años diferentes métodos para hacer explícita la información contenida en los textos y relacionarla con la realidad que describen.

Por lo tanto, el lenguaje es y debe estar en el centro de nuestros esfuerzos para desarrollar la Inteligencia Artificial, y viceversa. De hecho, actualmente, la Tecnología del Lenguaje es posiblemente el campo más innovador de la Inteligencia Artificial con un impacto económico de crecimiento acelerado. Actualmente estamos asistiendo a unos avances impresionantes e inimaginables hace unos años. De hecho, el PLN es una de las áreas de aplicación funcional más importantes. Se calcula que más del 50% de la inteligencia artificial es PLN. 

A pesar de la dificultad inherente de muchas de las tareas que se realizan, el grado de desarrollo actual de la TL permite ya muchas aplicaciones avanzadas impensables hace pocos años. La TL está presente en nuestra vida diaria, aunque no seamos conscientes de ello. Por ejemplo, a través de buscadores de información, sistemas de recomendación, asistentes virtuales, chatbots, correctores de texto, predictores de texto, sistemas de traducción automática, subtitulación automática, resúmenes automáticos, tecnología inclusiva, etc. así como, en la administración, a través de verticales como educación, sanidad, justicia, turismo… Su rápido desarrollo en los últimos años augura resultados aún más sorprendentes en un futuro muy cercano.

Desafortunadamente, tal y como demuestran los resultados del proyecto European Language Equality, este notable progreso tecnológico no se desarrolla por igual en todas las lenguas. Existe una distancia abismal entre ellas. Es una oportunidad la que tenemos con el multilingüismo, ya que se estima que la mitad de la población es bilingüe. Como ejemplo, el PLN atendió al 50% de la población que usa más de un idioma a la vez. En este contexto, el objetivo de esta jornada es dar respuesta a los siguientes retos:

  • Cómo hacer con éxito la transición digital multilingüe; cómo garantizar la pervivencia digital de nuestras lenguas y culturas.

  • Cómo rentabilizar socioeconómicamente el multilingüismo: innovación, servicios, productos y nuevos modelos de negocio.

Quisiera hacer mención muy brevemente al PERTE sobre la nueva economía de la lengua, aprobado en marzo por el gobierno y que nos acompañan en esta jornada la comisionada y su director, y a los que agradezco que hayan aceptado nuestra invitación. Consideramos el PERTE un acierto, es necesario aunque no suficiente, para llevar a las lenguas cooficiales a un estado de madurez tecnológica que las sitúe a la vanguardia de la sociedad y economía digitales, y que esto permita a su vez el desarrollo de una industria que pueda liderar incluso a escala mundial los servicios, productos y aplicaciones basados en TL, en particular en español. La TL está contribuyendo al desarrollo de sociedades digitales inclusivas, y son útiles para la transformación digital y responder a los desafíos sociales (multilingüismo, accesibilidad, transparencia y equidad).

Tenemos una ventana de oportunidad que tendrá, en todo caso, una duración temporal limitada. En el horizonte del 2025 deberían ser evidentes los resultados del PERTE como plan de choque para la maduración tecnológica del español y las lenguas cooficiales del estado. De otro modo se perderá, quizás definitivamente, la oportunidad de que España lidere la economía alrededor de la TL en sus lenguas.

Como se pondrá de manifiesto en la jornada, las iniciativas de diferentes gobiernos autonómicos en este sentido, como son las iniciativas públicas con lengua propia, las del País Vasco, Galicia y Cataluña, concretamente con el Gaitu, Nós y Aina respectivamente. Así como al Perte al que ya he hecho referencia a nivel estatal.

Se deben de adoptar decididas políticas científicas para su correcto y eficiente despliegue, y contribuir con ello al progreso de la ciencia, la sociedad y el conocimiento. Es por tanto necesario que desde la SEPLN se influya en la equidad de las lenguas cooficiales y se involucre a los investigadores y a la academia (universidades), ya que contamos con centros de investigación de diferentes universidades relevantes y competitivos en PLN, como los que colaboran en esta jornada (Hitz, Citius, CEATIC, CENID y BSC),  así como grupos de investigación por todo el territorio estatal.

Esperemos sacar el máximo provecho a esta jornada, corta pero intensa, a través de mesas redondas se dará respuesta a la situación del multilingüismo en los ámbitos de industria, investigación y formación en PLN (TLH).”

]]>
https://www.unibertsitatea.net/blogak/ixa/2022/06/01/alfonso-urena-hizkuntzaren-ekonomia-berriko-jardunaldian-2022-06-01/feed/ 0
Bingen Zupiria, Hizkuntzaren ekonomia berriko jardunaldian (2022-06-01) https://www.unibertsitatea.net/blogak/ixa/2022/06/01/bingen-zupiria-hinkuntzaren-ekonomia-berriko-jardunaldian-2022-05-31/ https://www.unibertsitatea.net/blogak/ixa/2022/06/01/bingen-zupiria-hinkuntzaren-ekonomia-berriko-jardunaldian-2022-05-31/#respond Wed, 01 Jun 2022 09:17:06 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=3096
Bingen Zupiria, Eusko Jaurlaritzako Kultura Sailburua.

Hizkuntzaren ekonomia berriko trantsizio digital eleaniztunari buruzko jardunaldia antolatu dugu Donostiako Miramar jauregian. Galdera hauei erantzuteko asmoz:

  • Nola egin arrakastaz trantsizio digital eleaniztuna; nola bermatu gure hizkuntzen eta kulturen iraupen digitala?
  • Nola bihurtu sozioekonomikoki errentagarri eleaniztasuna: berrikuntza, zerbitzuak, produktuak eta negozio-eredu berriak?

SEPLN Hizkuntza Naturala Prozesatzeko Espainiako Elkarteak, Eusko Jaurlaritzako Kultura Sailaren eta UPV/EHUko HiTZ zentroaren lartean antolatu dugu.

Hau da Eusko Jaurlaritzako Kultura Saiburu Bingen Zupiriaren hasierako interbentzioa:

Egun on guztioi eta mila esker gaur Donostiara hurbildu zareten guztioi. Azken urteotan teknologiaren eraginez, gauza asko aldatu dira gure hizkuntzentzat.
Ikusi dugu hizkuntza-teknologiei esker, adimen artifizialari esker, euskara bezalako hizkuntzentzat aukera berriak sortu direla gure hizkuntzaren erabilera areagotze eta indartze aldera.
Kontzeptu berriak ere agertu dira, adibidez, gaur jardunaldi honen ardatzean dagoena: “Hizkuntzaren ekonomia berria”. Orain gutxi “Hizkuntzen industriei” buruz hitz egiten genuen, baina teknologiarekin gertatzen den moduan, hizkuntza ere etengabe aldatzen ari da.Gure gizartea gero eta eleaniztunagoa eta gero eta teknologikoagoa da, eta errealitate horrek gobernuok politika zehatzak diseinatzera eta gauzatzera garamatza.

Eva Ferreira, Bingen Zupiria, eta Allfonso Ureña.

Horrela, hemen gauden gobernuok estrategia digitalak, planak, ekintza-planak eta antzekoak onartu ditugu gure gobernuetan, hain zuzen, gure hizkuntzak hizkuntza-teknologietan integratzeko eta gure herritarrei Administrazioarekiko harremanetan nahiz eguneroko bizitzan, teknologia baliatuta, haien aukerako hizkuntza erabil dezaten bermatzeko. Hizkuntzek elkarren ondoan bizi behar dute, handiek eta txikiek;  Baina Hizkuntza guztiak ez daude egoera berean; eta herritar guztion ere ez, hizkuntzen desberdintasun horren ondorioz.

Guztiok nahi eta behar dugu geure tokia mundu berri honetan eta denon obligazioa da hizkuntza guztien trantsizio digital arrakastatsua bultzatzea eta gauzatzea. Baita hiztun gutxiago dituzten hizkuntzena ere. Eusko Jaurlaritzak “GAITU Hizkuntza-teknologien Ekintza-plana 2021-2024” (www.euskadi.eus/gaitu) jarri du martxan.  Jaurlaritzako sailen arteko Ekintza-plana da eta abian dauden proiektuak jasotzen ditu, baita legegintzaldian zehar garatuko direnak ere. Badakigu oso garrantzitsua izango dela proiektu horiek guztiak aurrera eramatea eta berriak txertatzea.
Ekintza-plan hau irekia da, moldagarria, dinamikoa eta etengabe eguneratuko da. Administraziotik herritarrei zerbitzu on eta aurreratuak ematea da Ekintza-planaren lehenengo fase honen helburua, baina, aurrerantzean, ikerketa ere txertatzea aurreikusi dugu.

Hizkuntza-teknologietan eta adimen artifizialean euskara modu eraginkorrean integratzearen ardatza elkarlana da, hau da, erakunde publikoen konpromisoa  eta ikerketa-zentroen eta enpresen ezagutza eta esperientzia (eskarmentua) etengabe uztartzea ezinbestekoa da. Elkarlan hori beti izan da gure printzipioa eta praktika, hemen, gure artean.
Bide horretan jarraitzeko eta euskara hizkuntzak Adimen Artifizialean behar duen garapena izan dezan, hain zuzen, programak eta proiektuak bideratu ahal izateko, laguntza handia izan daiteke Espainiako Gobernuak onartu Hizkuntzaren Ekonomia berriaren PERTEa. Oso garrantzitsua da Gaztelaniak ekonomia berrian izan behar duen tokia bermatzea, baina era berean, nahieta nahi ezkoa da Estatu espainiarreko beste hizkuntza ofizialentzat ere diru-baliabideak esleitzea ahalik eta lasterren. Gaztelania ez diren Estatuko beste hizkuntzek, garapen teknolinguistikoa dela eta, bermatu beharra daukate beren etorkizuna mundu digitalean.
Ez da hautazko kontu bat. Hitz ala biziko kontua da. Izatea edo ez izatea, hori izango da kontua.

Bestalde, ezin ahaztu ikerketa eta, zentzu horretan, Estatuko Gobernuari lankidetza luzatzen diogu Europa mailako CLARIAH proiektuan (Digital Humanities resources and infrastructures) parte hartzeko.
Gure hizkuntza-teknologietako ikerlarientzat aukera garrantzitsua litzateke Estatuko Gobernua proiektu horretako kide balitz (Estatuak izan behar dira kide).  Eusko Jaurlaritza proiektu horretan Euskadiko bi ikerlari jartzeko prest dagoela adierazi nahi dizuet. La incorporación del euskera y de las otras lenguas cooficiales del estado español al mundo de las tecnologías de la lengua y de la inteligencia artificial no es una opción.
Es una cuestión de supervivencia. Y su logro solo será posible mediante el trabajo en común, es decir, mediante el compromiso de las instituciones públicas y el conocimiento y la experiencia de los centros de investigación y de las empresas. Esa colaboración siempre ha sido nuestro principio y nuestra manera de trabajar.  Para poder continuar en ese camino y que el euskera tenga el desarrollo necesario en la Inteligencia Artificial, para poder canalizar programas y proyectos, el PERTE de la nueva economía de la lengua recientemente aprobado por el Gpbierno de España debe ser una herramienta fundamental.
No concebimos un futuro digital europeo o mundial en el que los ciudadanos no tengamos la libertad de elegir nuestra lengua de comunicación y tengamos que renunciar al uso de una de nuestras lenguas.
Ese es el reto y la oportunidad que las tecnologías de la lengua y la inteligencia artificial nos ofrecerán si somos capaces de impulsar las políticas adecuadas. Y es urgente que lo hagamos ràpido y bien.

Es legítimo que las instituciones públicas en el estado español busquen el protagonismo del castellano en el escenario universal en el que vamos a vivir. Pero además de legítimo, es una obligación de todos que todas las lenguas del estado español tengan asegurada su presencia y desarrollo en el mundo digital. Es una cuestión de democracia e igualdad y atañe a todas las instancias del estado español. Es obligación de todas nuestras instituciones que todas nuestras lenguas puedan acceder, existir, competir, desarrollarse y pervivir en un nuevo mundo digital, que sí o sí deberá ser multi y plurilingÜe como es la realidad analógica del estado español.
Preocuoación del Gpobvbierno vasco por como se han planteado y sustanciado los fondos europeos. Vemos en el Perter de la economía de la lengua una oportunidad que no deberíamos desperdiciar
Así quiero trasladarles la disposición del Gobierno Vasco a poner a disposición de este proyecto a dos personas investigadoras de Euskadi.

Amaitzeko, esan, hizkuntza koofizialak ezin direla atzera geratu Hizkuntzaren Ekonomia Berrian. Beraz, jardunaldi honek argibide interesgarriak eta lankidetzarako eta konpromisorako aukera paregabea izatea espero dugu. Eskerrik asko! “

]]>
https://www.unibertsitatea.net/blogak/ixa/2022/06/01/bingen-zupiria-hinkuntzaren-ekonomia-berriko-jardunaldian-2022-05-31/feed/ 0
HiTZ zentroa = IXA + Aholab (Aurkezpen ekitaldia, 2020-11-05) https://www.unibertsitatea.net/blogak/ixa/2020/11/06/hitz-zentroa-ixa-aholab-aurkezpen-ekitaldia-2020-11-05/ https://www.unibertsitatea.net/blogak/ixa/2020/11/06/hitz-zentroa-ixa-aholab-aurkezpen-ekitaldia-2020-11-05/#respond Fri, 06 Nov 2020 19:17:34 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=2935
Jokin Bildarratz, Hezkuntza sailburua

Atzo HiTZ ikerketa-zentro berria aurkeztu genuen.
Eneko Agirre zuzendariarekin batera egon ziren Nekane Balluerka errektorea, Jokin Bildarratz, Hezkuntza sailburua, Markel Olano Diputatu Nagusia eta Eneko Goia alkatea.

UPV/EHUko IXA eta Aholab ikerketa-taldeen artean sortu dugu HiTZ.
Formakuntzan, ikerketan eta teknologiaren transferentzian egiten duguna batuz ikerketa-zentro berri honek Hizkuntza Teknologian motor eta erreferentzia gisa jokatu nahi du nazioartean.

Eneko Agirre zuzendaria

Guztira 60 kide gara, irakasle, ikertzaile, teknikari eta doktoretza-ikasleak kontuan hartuta.
Diziplinarteko adituen talde zabala biltzen du HiTZek: informatikariak, hizkuntzalariak, ingeniariak, itzultzaileak eta soziologoak, besteak beste. 

IXA Taldean 32 urteko ibilbidea dugu idatzizko edukien tratamenduan,
Aholab t
aldeak 1998tik dihardu ahozko edukien tratamenduan.
2002az geroztik lankidetzan ari gara bi ikerketa-taldeak, eta orain
bat egin dugu HiTZ zentroan.
Mundu mailan ikerketa-gune eta garapen-
gune garrantzitsua gara, adimen artifizialaren inguruko beste eragileekin batera. Egun 36 ikerkuntza-proiektutan dihardugu lanean, horietako seitan Europan eta Estatu Batuetan. Azken urtean 78 zientzi-artikulutan zabaldu dugu lortutako emaitzak.

Formakuntzari dagokionez, Erasmus Mundus nazioarteko masterra eskaintzen dugu, hizkuntzaren teknologien inguruko doktorego-programa, baita “Deep Learning” tekniken inguruko nazioarteko ikastaroa ere. Donostiako Informatika Fakultatean berriki eratu den Adimen Artifizialeko Graduan ere zeregin garrantzitsua dugu.

Ikerketan, hizkuntza-teknologietako punta-puntako hainbat adarretan dihardute lanean: itzulpengintza automatikoa, informazioaren erauzketa, testu masiboen analisia eta gizaki-ordenagailu elkarrizketak, besteak beste. Teknologiaren transferentziaren alorrean, azkenik, enpresei ideia berritzaileen inguruan, bai eta prototipo industrialak sortzen lagundu ere. Joan den urtean enpresekin aholkularitza emateko 34 kontratu izan genituen.

Jendartearentzako ekarpenak egiten ari zaizkio hainbat arlotan. Adibidez, ezgaitasuna duten pertsonak ingurune digitaletik kanpo gelditu ez daitezen, HiTZ zentroko ikerketek ahotsa galdu duten pertsonei ahotsa berriz izatea erraztu diete. Humanitate digitaletan, prentsan eta sare sozialetan gehien aipatzen diren pertsona eta gaien inguruko iritziak aztertzeko softwarea kasu. Estatu Batuetako gobernuak bultzatutako txapelketan COVIDaren inguruko galderak automatikoki erantzuten dituen sistemak saria irabazi du.

Nazioartean adimen artifizialean eta hizkuntzen teknologietan gako diren sare eta partzuergoetako kide dira HiTZeko ikertzaileak, hala nola CLARIN, CLAIRE, BDVA eta DAIRO. Hizkuntzen berdintasun digitalerako agenda estrategikoa idatziko duen European Language Equality (ELE) proiektuko kide nagusietako bat ere bagara.

Ongi etorri, HiTZ!            Urte askotarako!

]]>
https://www.unibertsitatea.net/blogak/ixa/2020/11/06/hitz-zentroa-ixa-aholab-aurkezpen-ekitaldia-2020-11-05/feed/ 0
Mintegia: irlanderarako itzulpen automatikoa (M. Dowling, 2019-03-11) https://www.unibertsitatea.net/blogak/ixa/2019/03/11/mintegia-irlanderarako-itzulpen-automatikoa-m-dowling-2019-03-11/ https://www.unibertsitatea.net/blogak/ixa/2019/03/11/mintegia-irlanderarako-itzulpen-automatikoa-m-dowling-2019-03-11/#comments Mon, 11 Mar 2019 11:26:03 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=2716
http://dcu.academia.edu/MeghanDowling

Noiz: Martxoaren 11n, 15:00etan.
Non: Informatika Fakultateko 3. 2 gelan.
Hizlaria: Meghan Dowling (doktorego-ikaslea, Dublin City University)
Izenburua: Irlanderarako itzulpen automatikoa / Irish Machine Translation and Resources
Hizkuntza: Ingelesa
Laburpena:Irlandera Irlandan eta Europan hizkuntza ofiziala denez, itzulpengintzarako  laguntza-eskaera handia dago administrazio publikoetan. mintegiko saioan ingeles eta irlanderaren arteko itzulpengintza automatikoaren egoera aurkeztuko da, dauden baliabideekin eta etorkizunera begira zabaltzen diren aukerekin.

Summary: As an official language in both Ireland and the EU, there is a high demand for Irish language translation in public administration. The difficulty that translators face in meeting this demand leads to an even greater need for English-Irish (EN-GA) machine translation (MT). This presentation will discuss the advances in EN-GA MT that have been made so far, the language resources gathered, as well as some possible avenues for future research.

Bio: Meghan Dowling is a PhD student in the ADAPT Centre, Dublin City University. Her PhD topic focuses on improving English-Irish machine translation. She is visiting IXA group for 3 months to learn about how Basque resources and MT have improved, with a view to using this knowledge to improve resources and MT for Irish.
]]>
https://www.unibertsitatea.net/blogak/ixa/2019/03/11/mintegia-irlanderarako-itzulpen-automatikoa-m-dowling-2019-03-11/feed/ 1
‘Euskaldunon Egunkaria’-ren hemeroteka digitalizatuaren aurkezpena martxoaren 1ean KMn https://www.unibertsitatea.net/blogak/ixa/2019/02/22/euskaldunon-egunkaria-ren-hemeroteka-digitalizatuaren-aurkezpena-martxoaren-1ean-kmn/ https://www.unibertsitatea.net/blogak/ixa/2019/02/22/euskaldunon-egunkaria-ren-hemeroteka-digitalizatuaren-aurkezpena-martxoaren-1ean-kmn/#respond Fri, 22 Feb 2019 09:01:21 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=2700

Ongi etorri hemeroteka honi! Eskerrik asko Euskaldunon Egunkariari, BERRIAri, eta Donostiako Koldo Mitxelena Kulturuneari.
Bejoindeizuela!

Ematen du amesgaiztoa bukatzen hasi dela. Egunkariaren auzia ixten ari da.
Orain dela 16 urte mezu hau zabaldu genuen hizkuntza-teknologiako hainbat eragilek hizkuntza-teknologiako hainbat posta zerrendetan. Eudkaldunon Egunkariaren hemeroteka dgitalizatuak, (Euskaldunon Egunkaria corpusa esaten diogu guk gure argitalpenetan) hizkuntza-teknologiari egin zion ekarpena gogora dezagun.Mila esker!

 

 

Subject: Today Basque is “an even more” endangered language. (2003/03/05)
Dear colleagues
We know that this kind of message is not common in this mailing list, but we would like to inform you about a direct attack to the Basque culture, which has a direct influence in our research efforts.
The only Basque language newspaper in the world “Egunkaria” was temporarily closed on February the 20th and 10 top representatives of Basque culture arrested by a Spanish judge, under allegations of collaboration with terrorists. We want to stress that there has not been any trial yet; they have been held in protective custody. Before even finding the newspaper employees guilty, the judge decided to close down the newspaper. The closing of the newspaper is a preventive temporary measure, but Spanish law allows the closing to go on for five years. Even after a few weeks the newspaper becomes financially unfeasible.
It is worth mentioning that Egunkaria has the support of different political sensibilities in the Basque Society, and it is also well known in the International Community. The vast majority of Basque society does not agree with the closing of Egunkaria (list of supporters in http://www.euskalnet.net/ileturia/egunkaria/list.htm). The International Federation of Journalists (http://www.ifex.org/alerts/view.html?id=11985),
Reporters Without Borders (http://www.rsf.org/article.php3?id_article=4998)
and the president of the European Bureau of Lesser Used Languages, among others, have also criticized the measure.
Being Basque an endangered language (around 800.000 speakers) under a normalization process, currently available corpora are small in size, and one of the most promising sources for our research efforts was Egunkaria.
There is also an English version of it that would allow us to research on parallel corpora. One of the biggest linguistic corpora available for Basque is the compilation of the daily issues since 2000. Language technology was being used to search in their online news database (unfortunately, their internet edition was also closed). A document classification research project was underway, as well as a research project on a pragma-rhetorical analysis of the contents of EGUNKARIA.

We do not want to initiate a debate. If you want more information or to express your sympathy, please refer to
http://www.sustatu.com/english/egunkaria.

Today Basque is “an even more” endangered language.

Research groups and companies working on Human Language Technology from the Basque Country supporting this message:

   AHOLAB group (http://bips.bi.ehu.es)
   DELi group (http://www.deli.deusto.es)
   ILCLI group on semantics, pragmatics and rhetoric
(http://www.sc.ehu.es/ilcli)
   IXA NLP group (http://ixa.si.ehu.es)
   Code & Syntax (http://www.codesyntax.com)
   Diana Teknologia (http://www.diana-tek.com)
   Eleka (http://www.eleka.net)
   Elhuyar (http://www.elhuyar.com)
   Hizkia Informatika (http://www.hizkia.fr)
   UZEI (http://www.uzei.com)

]]>
https://www.unibertsitatea.net/blogak/ixa/2019/02/22/euskaldunon-egunkaria-ren-hemeroteka-digitalizatuaren-aurkezpena-martxoaren-1ean-kmn/feed/ 0
Hitzaldia: Sare neuronalak eta Linguistika. (M. Hulden, 2018-11-08) https://www.unibertsitatea.net/blogak/ixa/2018/11/08/hitzaldia-sare-neuronalak-eta-linguistika-m-hulden-2018-11-08/ https://www.unibertsitatea.net/blogak/ixa/2018/11/08/hitzaldia-sare-neuronalak-eta-linguistika-m-hulden-2018-11-08/#respond Thu, 08 Nov 2018 08:55:33 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=2642

Mans Houlden Colorado Unibertsitateko irakasle euskalduna aste honetan Donostian dago Masterreko eskolak direla eta

Gaur, ostegunean, 12:00etan hitzaldi bat ere emango du Ada Lovelace aretoan.:

Neural Networks and Linguistics. Talking Past Each Other? (M. Hulden)

 

]]>
https://www.unibertsitatea.net/blogak/ixa/2018/11/08/hitzaldia-sare-neuronalak-eta-linguistika-m-hulden-2018-11-08/feed/ 0
Mintegia: BIM proiektua, sintaktikoki etiketatutako corpus historiko bat osatzea (A. Estarrona, 2018-10-22) https://www.unibertsitatea.net/blogak/ixa/2018/10/22/mintegia-bim-proiektua-sintaktikoki-etiketatutako-corpus-historiko-bat-osatzea-a-estarrona-2018-10-22/ https://www.unibertsitatea.net/blogak/ixa/2018/10/22/mintegia-bim-proiektua-sintaktikoki-etiketatutako-corpus-historiko-bat-osatzea-a-estarrona-2018-10-22/#respond Mon, 22 Oct 2018 10:12:48 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=2632

 

Noiz: Urriaren 22an, 15:00etan.
Non: Informatika Fakultateko 3. 2 gelan.
Hizlaria: Ainara Estarrona
Izenburua: BIM proiektua.
Laburpena:

BIM proiektua (Basque in the making) martxan da.
Baionako IKER taldearekin batera aurrera eraman behar dugun proiektua da eta hauxe du helburu nagusia:
Sintaktikoki etiketatutako corpus historiko bat osatzea.
Non gauden une honetan?
Zein diren etorkizun hurbilean eman beharreko urratsak?.
Informazio gehiago kontsultatu nahi izanez gero, hauxe duzue webgunea: http://ixa2.si.ehu.eus/corpushistorikoa/eu

]]>
https://www.unibertsitatea.net/blogak/ixa/2018/10/22/mintegia-bim-proiektua-sintaktikoki-etiketatutako-corpus-historiko-bat-osatzea-a-estarrona-2018-10-22/feed/ 0
Ixa Taldea Arantzazuko Biltzarrean (2018-10-04) https://www.unibertsitatea.net/blogak/ixa/2018/10/12/ixa-taldea-arantzazuko-biltzarrean-2018-10-04/ https://www.unibertsitatea.net/blogak/ixa/2018/10/12/ixa-taldea-arantzazuko-biltzarrean-2018-10-04/#respond Fri, 12 Oct 2018 09:36:39 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=2567

Felix Ibargutxik DVn argitaratutako zutabea (2018-10-05)

Joan den astean, Xabier Artola Zubillaga taldekideak hitzaldia eman zuen Euskaltzaindiaren XVII. Biltzarrean (Arantzazutik mundu zabalera), Arantzazun. Hitzaldia Euskaltzaindiaren eskariz prestatu genuen, eta biltzarreko “Euskara batuaren etorkizuneko erronkak ingurune digitalean” izeneko saioan aurkeztu zuen Xabierrek, honako izenburu honekin: “Euskara (batua) ingurune digitalean: bidean ikasiXa eta etorkizuneko erronkak”.

Hizkuntzaren eta teknologiaren arteko bidegurutzeari buruzko hausnarketa txiki bat egin ondoren, hizkuntzaren tratamenduari buruz aritu zen aurkezpenean: hizkuntzaren tratamendua zer den, ikerkuntza eta formazioa zertan diren, arloan zertan ari garen (Ixa Taldean zein Euskal Herriko beste zenbait laborategi eta zentro teknologikotan) eta zertan ari diren hemengo erakundeak nahiz Europa eta Espainiakoak.

Gero, aurrerantzean nondik jo aipatu zuen, zenbait alderdi jorratuz: corpusgintza (Euskararen Erreferentzia Corpusa sortu beharra aipatu zuen, bereziki, sakabanatutako ahaleginak bateratu beharra eta edukiak ikerkuntzarako trabarik gabe zabaltzearen premia azpimarratuz), arauak eta estandarra, hiztegigintza eta terminologia, itzulpen automatikoa eta humanitate digitalak.

Bukatzeko, ondorio eta proposamen batzuk aletu zituen. Ondorioen artean, hauek:

  • Hizkuntza-teknologien arloak garrantzi estrategikoa du hizkuntzaren etorkizunari begira.
  • Hizkuntza-teknologia ardatz bat izango da Europan –eta Espainian– hurrengo urteetan, eta inbertsioak egingo dira. Euskal Herrian ere pareko plan bat behar genuke lehenbailehen.
  • Trena ez galtzeko, ikerkuntza eta trebakuntza espezializatuak bultzatzu behar dira, ez da aski egiten ari garena.
  • Hala ere, egokiera onean gaude erronkari heltzeko, aurretik egindako lanean oinarrituta; baina sinetsi eta mugitu beharra dago!

Eta hiru proposamen hauek ere egin zituen, dagokionak aintzat har ditzan:

  1. Erreferentzia-zentro bat sortzea unibertsitatearekin eta Langune/Eiken-ekin lankidetzan. UPV/EHUren barruan sortu berri dugun HiTZ zentroa litzateke erreferentzia-zentro horri begirako lehen urratsa.
  2. Arloa Eusko Jaurlaritzaren hurrengo zientzia-planaren lerro nagusien artean sartzea, estrategikotzat hartzea.
  3. Euskaltzaindia ere eragile izatea honetan guztian, duen erreferentzialtasuna administrazioen aurrean baliatuz, gauzak bizkortu daitezen.

Hona hemen aurkezpenaren PDFa.
Eta bideo-grabazioa:

“Euskara batuaren etorkizuneko erronkak ingurune digitalean” saioko beste bi aurkezpenak:

]]>
https://www.unibertsitatea.net/blogak/ixa/2018/10/12/ixa-taldea-arantzazuko-biltzarrean-2018-10-04/feed/ 0
Ikasketa Sakona Testuen Prozesaketarako ikastaroa UC3M fundazioan (2018-10-04) https://www.unibertsitatea.net/blogak/ixa/2018/10/11/ikasketa-sakona-testuen-prozesaketarako-ikastaroa-uc3m-fundazioan/ https://www.unibertsitatea.net/blogak/ixa/2018/10/11/ikasketa-sakona-testuen-prozesaketarako-ikastaroa-uc3m-fundazioan/#respond Thu, 11 Oct 2018 08:38:11 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=2612
Aprendizaje profundo y procesamiento de texto.

Eneko Agirre eta Oier Lopez de Lacallek, Madrileko Carlos III unibertsitateko fundazioaren eskutik antolatuta, testuen prozesamendurako baliagarriak diren ikasketa sakoneko (deep learning, ingelesez) tekniken ikastaroa eman dute: Aprendizaje profundo y procesamiento de texto.

Ikastaroa EHU-UPVn ematen duten Erasmus Mundus LCT eta Hizkuntzaren Azterketa eta Prozesamendua (HAP-LAP) masterretan eskaintzen duten kurtsoan oinarritu da. Madrilen emandakoa 20 ordutara murriztu da. Azalpen teorikoez gain, alde praktikoa ere landu dute bertaratutakoek eta Pythonerako Keras liburutegia erabiltzen ikasi dute ikasleek.

Kurtsoak hizkuntza naturalaren tratamendurako ikasketa sakoneko oinarrizko arkitektura eta tekniken errepaso zabala egiten du eta ikasleei erautsi die noiz eta nola aplikatu behar diren existitzen diren hainbat teknika. Oinarrian ondoko gaia jorratu dira kurtsoak iraun duen hiru egunetan zehar: Lengoaia naturalaren prozesamendu eta ikasketa automatikoaren sarrera bat eman zaie hasteko eta, ondoren, MLP, RNN eta CNN arkitekturak testuekin nola aplika daitezkeen azaldu zaie ikasleei.

Arrakasta handiko kurtsoa izan da, izan ere, 26 ikasle izan dute Eneko eta Oierrek eta, hori gutxi ez balitz, hainbat ikasleek kanpoan geratu behar izan dute kupoa denbora gutxian bete zelako. Ikasleen artean diziplina eta ezagutza askotarikoak izan dira. Matematikari, hizkuntzalari eta informatikariak bildu dira hiru egunez ikasketa sakonari buruz ikasteko. Oro har, egindako barne inkestaren arabera, ikasleak oso pozik geratu dira jasotako klaseekin.

Erne! Ikastaroaren bertsio luzea urtarril-otsailean emango dugu Donostian, eman izena abenduaren 15 baino lehenago: http://ixa2.si.ehu.es/deep_learning_seminar/

Ikastaro luzearen programa
]]>
https://www.unibertsitatea.net/blogak/ixa/2018/10/11/ikasketa-sakona-testuen-prozesaketarako-ikastaroa-uc3m-fundazioan/feed/ 0
Eneko Agirreren hitzaldi gonbidatua LaBDA taldearen mintegian (2018-10-03) https://www.unibertsitatea.net/blogak/ixa/2018/10/10/eneko-eta-oier-madrileko-labda-taldearen-mintegian-2018-10-03/ https://www.unibertsitatea.net/blogak/ixa/2018/10/10/eneko-eta-oier-madrileko-labda-taldearen-mintegian-2018-10-03/#respond Wed, 10 Oct 2018 16:16:55 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=2594 Eneko Agirre Ixa-kideak “Traducción Automática no supervisada” hitzaldia eman du Madrilen urriaren 3an.

“Cross-linguality and machine translation without bilingual data” mintegiaren barruan kokatuta dago ikastaroa,

Antolatzailea taldea izan da  (Instituto Mixto UC3M Santander Big Data Financiero)

]]>
https://www.unibertsitatea.net/blogak/ixa/2018/10/10/eneko-eta-oier-madrileko-labda-taldearen-mintegian-2018-10-03/feed/ 0