Sariak – Hizkuntza-teknologiak, Ixa Taldearen bloga https://www.unibertsitatea.net/blogak/ixa IXA taldea. Hizkuntzaren prozesamendua Wed, 31 May 2023 21:32:01 +0000 eu hourly 1 https://wordpress.org/?v=4.9.23 https://www.unibertsitatea.net/blogak/ixa/files/2018/10/ixa.jpg Sariak – Hizkuntza-teknologiak, Ixa Taldearen bloga https://www.unibertsitatea.net/blogak/ixa 32 32 Kubako sari akademiko gorena Xabier Artola Ixakideari (2023-02-16) https://www.unibertsitatea.net/blogak/ixa/2023/02/16/kubako-sari-akademiko-gorena-xabier-artola-ixakideari-2023-02-16/ https://www.unibertsitatea.net/blogak/ixa/2023/02/16/kubako-sari-akademiko-gorena-xabier-artola-ixakideari-2023-02-16/#respond Thu, 16 Feb 2023 20:13:15 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=3135 Kubak “Carlos J. Finlay” Ordenaren Saria eman dio Ixa Taldeko Xabier Artola irakasleari 2023ko otsailaren 16an. Kubako zientzialari nazionalei eta atzerritarrei ematen dien kondekoraziorik gorena da hori. Artolari Kubarekin 20 urteko lankidetza zientifiko emankorrarengatik eman diote saria. Santiagoko Linguistika Aplikatuaren Zentroarekin bereziki.

Xabier Artolari Carlos J. Finlay saria  emateko ekitaldia(Kuba, 2023-02-16)

Euskal Herriko Unibertsitateko IXA taldea lankidetzan aritu izan da 2001tik CLA ikergunearekin. Hortik atera da, adibidez, Diccionario Básico Escolar Cubano (DBE) hiztegia (digitala eta paperezkoa). Lankidetza honen barruan mende hasieran sortu zen lehenengo bertsioan hiztegiaren diseinu informatikoa oso aurreratu izan zen: XML lengoaia kodetuta dago), eta hiztegiak editatzeko Ixa taldean garatu zen leXkit izeneko ingurunea erabiltzen zen. Geroago hiztegiaren lau edizio (2005, 2008, 2009, 2013-2015) argitaratu dira Kuban, paperean eta digitalki. Hiztegiaren sortzaileak Eloína Miyares Bermúdez eta Vitelio Ruiz Hernández linguistak ziren. Urteetan zehar zabalkuntza handia izan du hiztegiak Kubako eskoletan. 2023. urtera arte guztira hiztegiaren 300.000tik gora ale salduta zeuden paperean, eta bertsio elektronikoan 1100 CD.

Irakurri gehiago:

]]>
https://www.unibertsitatea.net/blogak/ixa/2023/02/16/kubako-sari-akademiko-gorena-xabier-artola-ixakideari-2023-02-16/feed/ 0
Espainiako Informatika-Ikerketako Sari bana eman diete Eneko Agirre eta Mikel Artetxeri (elkarrizketak eta esker-hitzak, 2021-11-18) https://www.unibertsitatea.net/blogak/ixa/2021/11/23/espainiako-informatika-ikerketako-sari-bana-eman-diete-eneko-agirre-eta-mikel-artetxeri-elkarrizketak-eta-esker-hitzak-2021-11-18/ https://www.unibertsitatea.net/blogak/ixa/2021/11/23/espainiako-informatika-ikerketako-sari-bana-eman-diete-eneko-agirre-eta-mikel-artetxeri-elkarrizketak-eta-esker-hitzak-2021-11-18/#respond Tue, 23 Nov 2021 00:34:09 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=3046
Eneko Agirreri eta Mikel Artetxeri Ixakideei SCIE-FBBVA 2021 ikerketa sari bana emateko ekitaldi ofiziala atzo izan zen Madrilen. Estatu mailan informatikako sari nagusia dena jaso dute. Enekok Aritmel saria jaso zuen eta Mikelek ikertzaile gazteen sarietako bat. Zorionak Eneko eta Mikel!
Ekarri dugu hona ekitaldian aurkeztu ziren bideoak eta eskerrak emateko Enekok eta Mikelek esan zutena (ikusgarriak)
Irudia

Eneko Agirrerentzat izan da Espainiako Informatika-Ikerketa Saria (Aritmel Saria)

Epaimahaiak azaldu du hizkuntzaren prozesamenduaren esparruan egindako ekarpen bikainengatik eman diotela; bereziki, testu-baliabide handien ustiapenean, eta itzulpen automatikoari aplikatutako neurona-konputazioan oinarritutako ikasketa automatiko ez-gainbegiratuan. Aipatu du, gainera, zientzia-argitalpenen kalitate bikainagatik ez ezik (bere argitalpen horietako batzuk erreferentetzat hartzen dira mundu mailan), bere ikerketaren emaitza-transferentzia handiagatik, zientzia-lidergoagatik —Hitz ikerketa-zentro ospetsuaren zuzendaria da— eta nazioarteko ibilbide oso nabarmenagatik, bai prestakuntzan, bai lankidetzetan.

 

Eneko Agirreren esker-hitzak

Antes de todo doy las gracias a la FBBVA, a la SCIE, al jurado y a la Sociedad Española para el Procesamiento del Lenguaje Natural por este reconocimiento.

El lenguaje es la base de la comunicación, desde los sentimientos más íntimos a las ideas más complejas. Es la base del progreso, donde el conocimiento descubierto en cada generación se ha codificado para poder transmitirlo a las generaciones siguientes. Y también fuente de riqueza y diversidad para las culturas del planeta. Cada idioma es un tesoro.

Ha sido además una de las grandes promesas de la Inteligencia Artificial desde sus inicios, incumplidas hasta hace bien poco. En escasos años el aprendizaje profundo ha revolucionado el área, dando lugar a grandes avances en investigación que en pocos meses han pasado a ser productos comerciales, tales como la traducción automática y el reconocimiento de voz.

Entre los descubrimientos inesperados de estos últimos años está el que hizo nuestro grupo, un algoritmo que por primera vez era capaz de traducir entre idiomas sin necesidad de diccionarios bilingües.

Pero la inteligencia artificial aprende de una manera muy distinta a la humana. Las personas aprenden tareas de muy pocos ejemplos y normalmente lo hacen mediante la interacción. Los sistemas artificiales en cambio requieren de grandes y costosas cantidades de ejemplos de entrenamiento. Pero eso también está cambiando con los modelos pre-entrenados.

Por ejemplo, acabamos de crear en nuestro grupo un programa que distingue menciones de eventos (p.ej. brotes epidémicos) aprendiendo de solamente uno o dos
ejemplos por clase. También hemos presentado un premiado algoritmo de pregunta-respuesta capaz de aprender de la mera interacción con usuarios. Todo ello de una forma más cercana a la humana, y abaratando los costes de la IA industrial.

A pesar de estos resultados y los de otros grupos notables en PLN, la mayoría de los avances se dan en otros países y la brecha en atracción de talento se acrecienta, como muestra la baja tasa de publicación en congresos. Esperamos pues con ilusión que la Estrategia Nacional en IA y el Plan Nacional de Tecnologías del Lenguaje den empuje a la investigación y así evitar que seamos meros consumidores de tecnología de terceros. En ello trabajamos en el grupo Ixa desde hace más de 25 años, investigando
de modo cooperativo. Resultado de ello es la creación del centro de investigación HiTZ, Centro Vasco de Tecnología del Lenguaje, el centro de investigación más productivo en procesamiento del lenguaje natural. Es a todos los miembros de Ixa, en especial a sus fundadores, que debo este premio y mi agradecimiento final. Mila esker! Gracias!

Mikele Artetxerentzat izan da Ikertzaile Gazteentzako Informatika Sarietako bat,

Mikele Artetxerentzat izan da Ikertzaile Gazteentzako Informatika Sarietako bat, arloko SCIE elkarte nagusiak ematen duena (Sociedad Científica Informática de España). Epaimahaiak saria eman dio nazioartekoan duen presentzia handiagatik, hizkuntzaren prozesamenduaren arloko enpresa garrantzitsuenetan egindako egonaldiengatik eta ospe handiko biltzarretan egindako ekarpenengatik.[17]

 

Mikel Artetxeren esker-hitzak

“Es un verdadero honor para mí recibir este premio por mi trabajo sobre el procesamiento del lenguaje natural. Me gustaría dar las gracias a todos los que han contribuido a este trabajo. Habría sido imposible sin el apoyo y la contribución de muchos colegas y amigos. Me gustaría agradecer especialmente a mi asesor, Jon Kleinberg, y a mi coautora, Stefanie Jegelka, todo su apoyo.

He tenido la suerte de pasar los dos últimos años en Google trabajando en un proyecto llamado Searchbased Question Answering (SQA). SQA es un proyecto de IA que trata de hacer posible la respuesta a preguntas utilizando la búsqueda de Google.”
Estas palabras que acabo de leer no las he escrito yo. Salvo la primera frase, el texto entero ha sido generado por una inteligencia artificial. En realidad no trabajo en Google sino en Facebook, donde investigo modelos de lenguaje que, entre otras cosas, pueden escribir discursos como ese.

Como habéis podido comprobar, la tecnología actual ya es capaz de generar texto fluido y coherente, dibujando un horizonte verdaderamente prometedor donde podremos interactuar de manera natural con una máquina. Pero todavía queda mucho por hacer, pues estos sistemas tienden a comportarse como bocas sin cerebro, y lo que he leído antes, aunque creíble, nada tiene que ver con la realidad. El reto científico que tenemos adelante es, pues, apasionante, pero también una responsabilidad conjunta. No debemos desconfiar de la inteligencia artificial temiendo que se vuelva demasiado inteligente, pero tampoco confiar en exceso en ella creyendo que es más inteligente de lo que es en realidad.

Para terminar, me gustaría corregir a la inteligencia artificial y dar las gracias a los verdaderos directores de mi tesis, Eneko Agirre y Gorka Labaka, por todo lo que me han enseñado, así como a FBBVA y SCIE por este reconocimiento.
]]>
https://www.unibertsitatea.net/blogak/ixa/2021/11/23/espainiako-informatika-ikerketako-sari-bana-eman-diete-eneko-agirre-eta-mikel-artetxeri-elkarrizketak-eta-esker-hitzak-2021-11-18/feed/ 0
Mikel Artetxeri Europako tesien saria Adimen Artifizialean https://www.unibertsitatea.net/blogak/ixa/2021/08/03/3020/ https://www.unibertsitatea.net/blogak/ixa/2021/08/03/3020/#respond Tue, 03 Aug 2021 09:06:30 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=3020 Mikel Artetxe Ixakideak orain dela urtebete aurkeztu zuen doktore-tesiari beste sari handi bat eman diote, estatu mailako saria eman zioten maiatzean eta orain abuztuan Europa mailako saria.
Adimen artifizialerako Europako elkarteak tesi onenarentzako saria eman dio atzo (Itzulpen automatiko gainbegiratu gabea  / Unsupervised Machine Translation). 

Zorionak Mikeli eta zuzendari biei, Eneko Agirre eta Gorka Labaka

 

 

Ikerketaren motibazioa, galderak:

Sekuentziatik sekuentziarako eredu neuronalaren etorrerak aurrerapen izugarria ekarri du itzulpen automatikoan. Horrek hobekuntza handia ekarri du itzulpen-sistema estandarretan eta horrela zenbait ingurunetan giza-itzulpenen kalitatearen maila lortu dute lehenengoz. Hala ere, gaur egun dauden sistemek datu asko behar dute (gainbegiratze sakona), corpus paralelo gisa normalean milioika perpaus behar izaten dituzte. Baina harrigarria da, baldintza hori ez du behar gizakiak hizkuntza eskuratzeko. Eta gainera arazo praktiko garrantzitsu bat planteatzen du euskara bezalako baliabide gutxiko hizkuntzekin itzulpenak egiteko.

Tesiaren helburua datu paraleloen mendekotasun hori guztiz ezabatzea da, corpus elebakarra baino beharko ez duten “gainbegiratu gabeko itzulpen automatiko”ko sistemak eratzeko. Horretarako, lehenengo urrats batean bi hizkuntzatarako sortutako hitz-bektoreak (word embedding-ak) lerrokatzen ditu, beren arteko egitura-antzekotasunean oinarrituta. Gero, bigarren urrats batean, lerrokatze horren emaitzak erabiltzen ditu itzulpen-sistema neuronal bat edo itzulpen-sistema estatistiko bat hasieratzeko, azken urratsean back-translationaren bidez hobetzen joango dena.

https://github.com/artetxem
https://github.com/artetxem

Tesiaren egindako bide progresiboa eta ekarpenak oso ondo jarraitu daiteke Mikel Artetxek 2016tik argitaratu zituen 9 artikulu hauen zehar:

]]>
https://www.unibertsitatea.net/blogak/ixa/2021/08/03/3020/feed/ 0
IKERGAZTEko sari berezia Joseba Fernandez de Landa-ri https://www.unibertsitatea.net/blogak/ixa/2021/06/11/ikergazte-kongresuko-sari-berezia-joseba-fernandez-de-landa-ri/ https://www.unibertsitatea.net/blogak/ixa/2021/06/11/ikergazte-kongresuko-sari-berezia-joseba-fernandez-de-landa-ri/#comments Fri, 11 Jun 2021 13:35:09 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=3005

Joseba Fernandez de Landak gaur Gasteizen bukatu den IkerGazte kongresuko sari berezia jaso du. Udalbiltzak eskaintzen du sari hori, Euskal Herriko garapenerako bereziki garrantzitsua den gaia lantzeagatik. Ingeniaritza eta Arkitektura alorrean egin du artikulu hori Josebak beste hiru Ixakiderekin: Iker García, Ander Salaberria, eta Jon Ander Campos,.

Joseba soziologoa da gizartearen kezkak nondik nora mugitzen diren aztertu nahi du. Bere tesian Twitterreko txioetan erabiltzen diren hitzak aztertzen ditu. urtez urte nola aldatzen diren miatzen du hizkuntza teknologia erabiliz. Ikergazte artikulu irabazle honetan Hizkuntzaren Prozesamenduak eskaintzen dituen teknika ez-gainbegiratuak erabili ditu euskarazko txioetan COVID-19aren pandemiak izan duen eragina aztertzeko.

Irakurri artikulu osoa, Kongresuko artikulu bilduman irakur dezakezu 137. orrialdean. Motibazio moduan hemen dituzu bertako irudi batzuk

  • Zeintzuk dira pandemia garaian erabileran hazkuntza nabarmena izan duten hitzek? Eta jaitsiera handiena jaso dituztenak? Logika dauka, ez da?
  • Zeintzuk dira txioetan  Covid hitzaren inguruan gehien erabili diren hitzak?

 

 

 

 

 

 

 

 

 

ZORIONAK Josebari eta bere zuzendaria den Rodrigo Agerriri!
Baita Iker, Jon Ander eta Ander laguntzaileei

]]>
https://www.unibertsitatea.net/blogak/ixa/2021/06/11/ikergazte-kongresuko-sari-berezia-joseba-fernandez-de-landa-ri/feed/ 1
Espainiako Informatika-Ikerketako Sari bana eman diete Eneko Agirre eta Mikel Artetxeri (elkarrizketak eta esker-hitzak, 2021-11-18) https://www.unibertsitatea.net/blogak/ixa/2021/05/21/espainiako-informatika-ikerketa-sari-bi-eneko-agirre-eta-mikel-artetxerentzat/ https://www.unibertsitatea.net/blogak/ixa/2021/05/21/espainiako-informatika-ikerketa-sari-bi-eneko-agirre-eta-mikel-artetxerentzat/#comments Fri, 21 May 2021 17:01:27 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=2992
Eneko Agirreri eta Mikel Artetxeri Ixakideei SCIE-FBBVA 2021 ikerketa sari bana emateko ekitaldi ofiziala atzo izan zen Madrilen. Estatu mailan informatikako sari nagusia dena jaso dute. Enekok Aritmel saria jaso zuen eta Mikelek ikertzaile gazteen sarietako bat. Zorionak Eneko eta Mikel!
Ekarri dugu hona ekitaldian aurkeztu ziren bideoak eta eskerrak emateko Enekok eta Mikelek esan zutena (ikusgarriak)
Irudia

Eneko Agirrerentzat izan da Espainiako Informatika-Ikerketa Saria (Aritmel Saria)

Epaimahaiak azaldu du hizkuntzaren prozesamenduaren esparruan egindako ekarpen bikainengatik eman diotela; bereziki, testu-baliabide handien ustiapenean, eta itzulpen automatikoari aplikatutako neurona-konputazioan oinarritutako ikasketa automatiko ez-gainbegiratuan. Aipatu du, gainera, zientzia-argitalpenen kalitate bikainagatik ez ezik (bere argitalpen horietako batzuk erreferentetzat hartzen dira mundu mailan), bere ikerketaren emaitza-transferentzia handiagatik, zientzia-lidergoagatik —Hitz ikerketa-zentro ospetsuaren zuzendaria da— eta nazioarteko ibilbide oso nabarmenagatik, bai prestakuntzan, bai lankidetzetan.

 

Eneko Agirreren esker-hitzak

Antes de todo doy las gracias a la FBBVA, a la SCIE, al jurado y a la Sociedad Española para el Procesamiento del Lenguaje Natural por este reconocimiento.

El lenguaje es la base de la comunicación, desde los sentimientos más íntimos a las ideas más complejas. Es la base del progreso, donde el conocimiento descubierto en cada generación se ha codificado para poder transmitirlo a las generaciones siguientes. Y también fuente de riqueza y diversidad para las culturas del planeta. Cada idioma es un tesoro.

Ha sido además una de las grandes promesas de la Inteligencia Artificial desde sus inicios, incumplidas hasta hace bien poco. En escasos años el aprendizaje profundo ha revolucionado el área, dando lugar a grandes avances en investigación que en pocos meses han pasado a ser productos comerciales, tales como la traducción automática y el reconocimiento de voz.

Entre los descubrimientos inesperados de estos últimos años está el que hizo nuestro grupo, un algoritmo que por primera vez era capaz de traducir entre idiomas sin necesidad de diccionarios bilingües.

Pero la inteligencia artificial aprende de una manera muy distinta a la humana. Las personas aprenden tareas de muy pocos ejemplos y normalmente lo hacen mediante la interacción. Los sistemas artificiales en cambio requieren de grandes y costosas cantidades de ejemplos de entrenamiento. Pero eso también está cambiando con los modelos pre-entrenados.

Por ejemplo, acabamos de crear en nuestro grupo un programa que distingue menciones de eventos (p.ej. brotes epidémicos) aprendiendo de solamente uno o dos
ejemplos por clase. También hemos presentado un premiado algoritmo de pregunta-respuesta capaz de aprender de la mera interacción con usuarios. Todo ello de una forma más cercana a la humana, y abaratando los costes de la IA industrial.

A pesar de estos resultados y los de otros grupos notables en PLN, la mayoría de los avances se dan en otros países y la brecha en atracción de talento se acrecienta, como muestra la baja tasa de publicación en congresos. Esperamos pues con ilusión que la Estrategia Nacional en IA y el Plan Nacional de Tecnologías del Lenguaje den empuje a la investigación y así evitar que seamos meros consumidores de tecnología de terceros. En ello trabajamos en el grupo Ixa desde hace más de 25 años, investigando
de modo cooperativo. Resultado de ello es la creación del centro de investigación HiTZ, Centro Vasco de Tecnología del Lenguaje, el centro de investigación más productivo en procesamiento del lenguaje natural. Es a todos los miembros de Ixa, en especial a sus fundadores, que debo este premio y mi agradecimiento final. Mila esker! Gracias!

Mikele Artetxerentzat izan da Ikertzaile Gazteentzako Informatika Sarietako bat,

Mikele Artetxerentzat izan da Ikertzaile Gazteentzako Informatika Sarietako bat, arloko SCIE elkarte nagusiak ematen duena (Sociedad Científica Informática de España). Epaimahaiak saria eman dio nazioartekoan duen presentzia handiagatik, hizkuntzaren prozesamenduaren arloko enpresa garrantzitsuenetan egindako egonaldiengatik eta ospe handiko biltzarretan egindako ekarpenengatik.[17]

 

Mikel Artetxeren esker-hitzak

“Es un verdadero honor para mí recibir este premio por mi trabajo sobre el procesamiento del lenguaje natural. Me gustaría dar las gracias a todos los que han contribuido a este trabajo. Habría sido imposible sin el apoyo y la contribución de muchos colegas y amigos. Me gustaría agradecer especialmente a mi asesor, Jon Kleinberg, y a mi coautora, Stefanie Jegelka, todo su apoyo.

He tenido la suerte de pasar los dos últimos años en Google trabajando en un proyecto llamado Searchbased Question Answering (SQA). SQA es un proyecto de IA que trata de hacer posible la respuesta a preguntas utilizando la búsqueda de Google.”
Estas palabras que acabo de leer no las he escrito yo. Salvo la primera frase, el texto entero ha sido generado por una inteligencia artificial. En realidad no trabajo en Google sino en Facebook, donde investigo modelos de lenguaje que, entre otras cosas, pueden escribir discursos como ese.

Como habéis podido comprobar, la tecnología actual ya es capaz de generar texto fluido y coherente, dibujando un horizonte verdaderamente prometedor donde podremos interactuar de manera natural con una máquina. Pero todavía queda mucho por hacer, pues estos sistemas tienden a comportarse como bocas sin cerebro, y lo que he leído antes, aunque creíble, nada tiene que ver con la realidad. El reto científico que tenemos adelante es, pues, apasionante, pero también una responsabilidad conjunta. No debemos desconfiar de la inteligencia artificial temiendo que se vuelva demasiado inteligente, pero tampoco confiar en exceso en ella creyendo que es más inteligente de lo que es en realidad.

Para terminar, me gustaría corregir a la inteligencia artificial y dar las gracias a los verdaderos directores de mi tesis, Eneko Agirre y Gorka Labaka, por todo lo que me han enseñado, así como a FBBVA y SCIE por este reconocimiento.
]]>
https://www.unibertsitatea.net/blogak/ixa/2021/05/21/espainiako-informatika-ikerketa-sari-bi-eneko-agirre-eta-mikel-artetxerentzat/feed/ 1
Ixa Taldeari esker ona Cubatik (CLA zentroak 50 urte) https://www.unibertsitatea.net/blogak/ixa/2021/05/13/ixa-taldeari-esker-ona-cubatik-cla-zentroak-50-urte/ https://www.unibertsitatea.net/blogak/ixa/2021/05/13/ixa-taldeari-esker-ona-cubatik-cla-zentroak-50-urte/#comments Thu, 13 May 2021 13:03:42 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=2984 Oso pozik gaude,  mezu hau jaso dugu gaur Santiago de Cubatik:

Euskal Herriko Unibertsitateko iXa taldeko kide maiteok:

Santiagoko Linguistika Aplikatuko Zentroak, bere 50. urteurreneko ospakizunen testuinguruan, eskerrak eman nahi dizkie bere zeregin zientifikoa garatzen luzaroan lagundu duten erakundeei eta pertsonei.

Zuek omendatutako kide eta erakunde horien artean zaudete, eta atsegin handiz bidaltzen dizuegu zuen diplomaren irudia. Espero dugu 2023ko urtarrilean ematea.

ESKERRIK ASKO IXAKO LAGUNEI !!!!!

Nire lankideen izenean, jaso ezazue besarkada handi bat.

                  Leonel Ruiz Miyares


Queridos miembros del Grupo iXa de la Universidad del Pais Vasco:

http://ixa2.si.ehu.es/dbe/index.html – Diccionario Basico Escolar

El Centro de Linguistica Aplicada de Santiago de Cuba en el contexto de las celebraciones por su cincuentenario desea agradecer a instituciones y a personalidades que han contribuido durante largo tiempo al desarrollo de su quehacer científico.

Ustedes estan entre esos colegas e instituciones homenajeados y les anexamos con mucho gusto una fotocopia de su diploma que esperamos entregarselo personalmente en enero del 2023.

MUCHAS GRACIAS AMIGOS de IXA!!!!!
En nombre de mis colegas, reciban un fuerte abrazo,

Dr. Leonel Ruiz Miyares
Director  Centro de Linguistica Aplicada (CLA)
Ministerio de Ciencia, Tecnología y Medio Ambiente
http://www.cla.cu/clanuevo/es/       – Sitio web del CLA
http://www.cla.cu/simposio/index.php – Sitio web Simposios
http://ixa2.si.ehu.es/dbe/index.html – Diccionario Basico Escolar


Eta hau izan da Xabier Arregik erantzun duena:

Estamos muy agradecidos por este reconocimiento, que significa mucho para Ixa.
La relación que mantenemos con el centro de Lingüística Aplicada de Santiago de Cuba es muy enriquecedora para nuestro grupo, porque nos brinda la oportunidad de conocer, contrastar y compartir desarrollos y avances en entornos que no son hegemónicos y dominantes en nuestra área. En el mundo, también en la Lingüística Aplicada y en las Tecnologías del Lenguaje, hay mucho más que el inglés y los países ricos.

Gure esker ona adierazi nahi dizuegu, Leonel,  asko esan nahi baitu eskutitz horrek Ixa taldearentzat.
Santiago de Cubako Hizkuntzalaritza Aplikatuko zentroarekin dugun harremana oso aberasgarria da gure taldearentzat, aukera ematen baitigu gure arloan hegemonikoak eta menderatzaileak ez diren inguruneetako garapenak eta aurrerapenak ezagutu, kontrastatu eta partekatzeko. Munduan, Hizkuntzalaritza Aplikatuan eta Hizkuntzaren Teknologietan ere, ingelesa eta herrialde aberatsak baino askoz gehiago daude.

Eskerrik asko, eta besarkada bero bat.

Xabier Arregi (Ixa Taldeko koordinatzailea)

 

Irakurri gehiago:

 

]]>
https://www.unibertsitatea.net/blogak/ixa/2021/05/13/ixa-taldeari-esker-ona-cubatik-cla-zentroak-50-urte/feed/ 1
Rodrigo Agerrik irabazi du CAPITEL@IberLEF2020 txapelketako NERC atalean https://www.unibertsitatea.net/blogak/ixa/2020/05/28/rodrigo-agerrik-irabazi-du-capiteliberlef2020-txapelketako-nerc-atalean/ https://www.unibertsitatea.net/blogak/ixa/2020/05/28/rodrigo-agerrik-irabazi-du-capiteliberlef2020-txapelketako-nerc-atalean/#comments Thu, 28 May 2020 08:56:59 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=2845 Rodrigo Agerri Ixakideak CAPITEL@IberLEF2020 lehiaketara aurkeztu dituen hiru sistemak lehenengo hiru postuetan sailkatu dira gaztelaniazko artikulu periodistikoetan agertzen diren entitate-izenak biltzeko eta sailkatzeko atalean. (Sub-task 1: Named Entity Reconition and Classification in Spanish News Articles).

Rodrigo Agerrirekin batera German Rigau, Ander Barrena eta Jon Ander Campos ere aritu dira talde-lanean.
Zorionak Rodrigori eta lan-talde osoari!

Hizkuntza Teknologia garatzeko PlanTL planaren esparruan, gaztelaniaren akademiak (RAE) eta Ekonomia Ministerioko Sustapen Digitaleko Estatu Idazkaritzak (SEAD) akordio bat sinatu zuten gaztelaniazko albisteekin corpus linguistiko idatzi bat garatzeko, espainieraren hizkuntza-baliabideen azpiegitura handitzeko. Corpus horren izena CAPITEL da (Corpus del Plan de Impulso a las Tecnologías del Lenguaje, Hizkuntzaren Teknologiak Sustatzeko Planaren Corpusa), eta hainbat komunikabide-hornitzailerekin egindako hitzarmenei esker, gaur egungo albisteak dituzten hainbat artikuluk osatzen dute. CAPITELek hiru etiketatze maila ditu: morfosintaktikoa (lema eta dependentzia unibertsalen moduko ezaugarriekin), sintaktikoa (Universal Dependencies v2 jarraituta) eta entitate izendunena.

CAPITEL corpusaren azpimultzo baten etiketatze linguistikoa egin da, etiketatze-automatikoa geroago eskuz zuzenduta. Eskuzko berrikuspena hizkuntzalari graduatuek egin dute, CAPITEL corpuserako berariaz sortutako Etiketatzeko Jarraibideak erabiliz. Izendatutako entitateen corpus zuzenduak milioi bat hitz inguru hartzen ditu, eta etiketatze sintaktikoarenak 250.000 gutxi gorabehera.

Corpusaren tamaina eta etiketatzeen izaera direla eta, CAPITEL@IberLEF2020 aterkiaren barruan IberLEF lehiaketan bi azpiataza proposatu zituzten:

  1.  Izendatutako entitateak biltzea eta sailkatzea  (honetan irabazi du Ixa Taldeak)
  2.  Dependentzia unibertsalaren azterketa.
]]>
https://www.unibertsitatea.net/blogak/ixa/2020/05/28/rodrigo-agerrik-irabazi-du-capiteliberlef2020-txapelketako-nerc-atalean/feed/ 1
Masterreko ikasleak irabazle EHealth-KD txapelketako erlazio-erauzketan https://www.unibertsitatea.net/blogak/ixa/2020/05/11/masterreko-ikasleak-irabazle-ehealth-kd-txapelketako-erlazio-erauzketan/ https://www.unibertsitatea.net/blogak/ixa/2020/05/11/masterreko-ikasleak-irabazle-ehealth-kd-txapelketako-erlazio-erauzketan/#respond Mon, 11 May 2020 07:45:43 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=2830 HAP-LAP masterreko ikasleak diren Oscar Sainz-ek eta Edgar Andrés-k eHealth-2020 txapelketan emaitza bikaina lortu dute Oier Lopez de Lacalle and Aitziber Atutxa irakasleekin aurkeztuta. Beraien taldea (IXA-NER-RE) txapelduna izan da erlazio-erauzketako azpiatazan, bigarrenari alde nabarmena aterata gainera.

Beren helburu nagusia erlazio-erauzketako azpiatazan parte hartzea bazen ere, beste bietan ere (entitate-ezagutzan eta domeinu-aldaketan) sistematxo bat aurkeztu zuten, eta laugarren geratu dira sailkapen orokorrean.

ZORIONAK Oscar Sainz, Edgar Andrés, Oier lopez de Lacalleri eta Aitziber Atutxari!
Lan bikaina egin dute!

Emaitzak hemen ikusgai:
https://knowledge-learning.github.io/ehealthkd-2020/results

IXA-NER-RE taldea erlazio-erauzketako 1. postuan

 

 

 

 

 

 

 

 

 

]]>
https://www.unibertsitatea.net/blogak/ixa/2020/05/11/masterreko-ikasleak-irabazle-ehealth-kd-txapelketako-erlazio-erauzketan/feed/ 0
Ixa ikerketa-taldeak Estatu Batuetako gobernuak bultzatutako COVID-19 gaixotasunaren inguruan antolatutako adimen artifizialeko txapelketan saria jaso du https://www.unibertsitatea.net/blogak/ixa/2020/05/07/ixa-covid-19-gaixotasunaren-inguruan-antolatutako-adimen-artifizialeko-txapelketan-saridun/ https://www.unibertsitatea.net/blogak/ixa/2020/05/07/ixa-covid-19-gaixotasunaren-inguruan-antolatutako-adimen-artifizialeko-txapelketan-saridun/#respond Thu, 07 May 2020 12:35:53 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=2814

CORD-19 delako txapelketa (COVID-19 Open Research Dataset Challenge) hainbat erakundek antolatu dute, tartean dira Allen Institute for AI, Chan Zuckerberg Initiative, Georgetown University, Microsoft Research, National Institutes of Health eta Etxe Zuriko Office of Science and Technology Policy. Antolatzaileek COVID-19, SARS-CoV-2 eta beste koronabirus batzuei buruzko 50.000 artikulu zientifikotik gora jarri dituzte eskuragarri munduko ikerketa-komunitatearentzat. Horrekin batera, adimen artifizialeko ikertzaileei ekintzarako deia egin zien hizkuntzaren prozesamenduan berriki egin diren aurrerapenak aplika zitzaten, COVID-19 gaixotasunaren aurkako borrokan ari diren zientzialariei laguntzeko literatura zientifiko horretan lagungarri zaien informazioa ahalik eta errazen bilatzen.

Txapelketaren lehen fasean 10 sari banatu dituzte, eta horietako bat irabazi du HiTZ zentroko Ixa taldean garatutako sistemak. Sistemaren garapenean Euskal Herriko Unibertsitateko Arantxa Otegi eta Jon Ander Campos ikertzaileek eta Eneko Agirre eta Aitor Soroa irakasleek hartu dute parte.

Ikus adibide batzuk  (CC-BY-SA)

Hauek garatutako sistemak COVID-19 gaixotasuna eta SARS-CoV-2 birusaren inguruan adituek dituzten lehentasunezko galderen erantzunak bilatzen ditu aipatutako artikulu zientifiko horiek aztertuz. Sistema hau erabilgarria da, besteak beste, koronabirusaren historiaren, birusaren kutsatze eta diagnostikoaren, gizakien eta animalien arteko ukipenean hartu beharreko prebentzio-neurrien eta aurretik egindako azterketa epidemiologikoetako ikasbideen inguruko galderen erantzunak aurkitzeko. Sistemaren emaitza Estatu Batuetako NIH delakoaren aditu talde batek epaitu du, eta “What do we know about diagnostics and surveillance?” (Zer dakigu diagnostiko eta zaintzari buruz?) gaiaren inguruko galdera-sortari hoberen erantzun dion sistema bezala aukeratu dute. Sistemak emandako erantzunak hemen ikusi daitezke.

]]>
https://www.unibertsitatea.net/blogak/ixa/2020/05/07/ixa-covid-19-gaixotasunaren-inguruan-antolatutako-adimen-artifizialeko-txapelketan-saridun/feed/ 0
Google-saria hirugarrenez irabazi du Eneko Agirre ixakideak https://www.unibertsitatea.net/blogak/ixa/2020/04/23/google-saria-hirugarrenez-irabazi-du-eneko-agirre-ixakideak/ https://www.unibertsitatea.net/blogak/ixa/2020/04/23/google-saria-hirugarrenez-irabazi-du-eneko-agirre-ixakideak/#respond Thu, 23 Apr 2020 05:25:39 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=2790

Eneko Agirrek aurten (martxoan) berriro lortu du Google-ren sari bat. Google Faculty Research Award saria hirutan lortu duen ikertzaile bakanetakoa da bera. Sariko 62.000 dolarrek ‘Conversational Question Answering agents that learn after deployment’ izeneko proiektua finantzatuko dute, erabiltzaileekin elkarrizketa-sistemak garatzeko.
Chatbot-ak eta adimen artifiziala.

HiTZ ikerketa-zentro sortu berriko zuzendaria da Eneko, Ixakidea  eta Informatika Fakultateko irakaslea. Proiektu irabazkean badira beste 6 ixakide hauek: Aitor Soroa eta Gorka Azkune irakasleak, Arantxa Otegi ikertzailea, Jon Ander Campos doktoretza ikaslea, Aitor Agirre Hizkuntza Prozesamenduan Masterreko masterreko ikaslea eta Eduardo Vallejo Informatikako graduko ikaslea.

Proiektua batez ere  ingelesezko elkarrizketetan zentratzen bada ere (sukaldaritzari eta elikadurari buruzko galderak), euskarazko elkarrizketekin ere lan egin dute. Horretarako iaz Ixa taldeak euskarazko elkarrizketak biltzeko boluntarioak erakartzeko kanpaina jarri zuen martxan. Kanpainak oso harrera ona izan zuen, eta pertsonei buruzko euskarazko elkarrizketak jaso ziren, Wikipedian dagoen informazioan oinarrituta (2.irudian adibide bat ikus daiteke). Norbaitek kanpainarekin bat egin nahi badu, nahikoa da http://ixa.eus/lagundu helbidera sartu eta izena ematea.

 

]]>
https://www.unibertsitatea.net/blogak/ixa/2020/04/23/google-saria-hirugarrenez-irabazi-du-eneko-agirre-ixakideak/feed/ 0