Biltzarrak – Hizkuntza-teknologiak, Ixa Taldearen bloga https://www.unibertsitatea.net/blogak/ixa IXA taldea. Hizkuntzaren prozesamendua Wed, 31 May 2023 21:32:01 +0000 eu hourly 1 https://wordpress.org/?v=4.9.23 https://www.unibertsitatea.net/blogak/ixa/files/2018/10/ixa.jpg Biltzarrak – Hizkuntza-teknologiak, Ixa Taldearen bloga https://www.unibertsitatea.net/blogak/ixa 32 32 Alfonso Ureña, Hizkuntzaren ekonomia berriko jardunaldian (2022-06-01) https://www.unibertsitatea.net/blogak/ixa/2022/06/01/alfonso-urena-hizkuntzaren-ekonomia-berriko-jardunaldian-2022-06-01/ https://www.unibertsitatea.net/blogak/ixa/2022/06/01/alfonso-urena-hizkuntzaren-ekonomia-berriko-jardunaldian-2022-06-01/#respond Wed, 01 Jun 2022 10:29:04 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=3098
Alfonso Ureña, SEPLN elkarteko presidentea.

Hizkuntzaren ekonomia berriko trantsizio digital eleaniztunari buruzko jardunaldia antolatu dugu Donostiako Miramar jauregian. Galdera hauei erantzuteko asmoz:

  • Nola egin arrakastaz trantsizio digital eleaniztuna; nola bermatu gure hizkuntzen eta kulturen iraupen digitala?
  • Nola bihurtu sozioekonomikoki errentagarri eleaniztasuna: berrikuntza, zerbitzuak, produktuak eta negozio-eredu berriak?

SEPLN Hizkuntza Naturala Prozesatzeko Espainiako Elkarteak, Eusko Jaurlaritzako Kultura Sailaren eta UPV/EHUko HiTZ zentroaren lartean antolatu dugu.

SEPLN Hizkuntza Naturala Prozesatzeko Espainiako Elkarteko Presidente Alfonso Ureñaren hasierako hitzak hauek izan dira:

Eva Ferreira, Bingen Zupiria, eta Allfonso Ureña. (arg.: Langune)

Eskerrak eman nahi dizkiet Eusko Jaurlaritzari, Kultura Sailari eta Euskal Herriko Unibertsitateko HiTZ zentroari. Bereziki, Eneko Agirre HiTZ zentroko zuzendariari, Eva Ferreira errektoreari eta Bingen Zupiria sailburuari. Eta eskerrak eman nahi dizkiegu hizkuntzaren ekonomia berriko trantsizio digital eleaniztunari buruzko jardunaldi honetan parte hartzen duten guztiei.

Hizkuntzaren teknologiaren potentzialtasunari erantzuna eman eta ezagutarazteko helburua du jardunaldi honek. Adimen artifizialaren iraultza gertatzen ari da, oro har, eta, bereziki, hizkuntza naturalaren prozesamenduarena. Gizarteko esparru eta sektore gehienetan sartzen ari da.

Utz iezadazu aipamen labur bat egiten  Hizkuntza Naturalaren Prozesamendurako Espainiako Elkartea (SEPLN) aurkezteko. Espainian ikerketa egituratzen duen elkartea. Ibilbide luzea du, 1983tik. Oso komunitate aktiboa da, irabazi asmorik gabekoa eta bazkide numerarioek, erakundeek eta enpresek osatua. Horren helburua da hizkuntza naturalaren prozesamenduaren esparruan ikerketari, irakaskuntzari edo prestakuntzari eta garapenari buruzko era guztietako jarduerak sustatu eta zabaltzea, bai nazio mailan, bai nazioartean. Azpimarratu behar da SEPLN kongresua Espainiako zaharrena dela informatikaren arloan, eta urtero egiten dela, etenik gabe, 1983an sortu zenetik, Donostian hain zuzen ere. Gizarteak giza kapital handia du, masa kritiko garrantzitsua, izen handiko ikertzaileak eta ikerketa-talde garrantzitsu eta nazioartekotuak biltzen baititu. Talde horiek Hizkuntzaren Teknologiako komunitate ia osoa osatzen dute, ez bakarrik Espainian, baita Iberoamerikako erreferentea ere bada.

Jardunaldiaren xedeari dagokionez, hizkuntza naturala harrigarria dela aipatu nahiko nuke. Ahalegin handiik gabe, ezezagun bati galde diezaiokegu nola aurkitu kafetegi bat edo hurbilago bazkaltzeko toki bat. Gure esperientziak, ezagutzak eta abar partekatu ditzakegu. Hizkuntza da informazioa transmititu eta atzitzeko modurik arruntena eta praktikoena. Hizkuntza erabiltzen dugu, gure komunikazio-ingurune naturala den aldetik, informazioa kodetzeko, gordetzeko, transmititzeko, partekatzeko eta manipulatzeko. Hain zuzen, eskura dagoen informazio digital gehiena egituratu gabeko informazioa da, dokumentu gisa hainbat hizkuntzatan (idatziak edo hitz egindakoak), eta hori erronka bat da informazio hori ustiatu eta prozesatu nahi duen edozein erakunderentzat. Izan ere, ez da erraza egituratu gabeko informazio digitala (testua eta ahotsa) prozesatzea, hainbat interpretazio baititu (anbiguotasuna), testuinguruari eta munduari buruzko ezagutzarik eza eta bere berezko konplexutasuna. Hizkuntzaren Teknologiak (TL), giza hizkuntza prozesatzeko gai diren sistemak aztertu eta garatzeaz arduratzen denak, hainbat metodo garatu ditu urteen bidez testuetako informazioa esplizitu egiteko eta deskribatzen duen errealitatearekin lotzeko.

Beraz, hizkuntza adimen artifiziala garatzeko gure ahaleginen erdigunean egon behar da, eta alderantziz. Izan ere, gaur egun, Hizkuntzaren Teknologia da, seguruenik, adimen artifizialaren eremurik berritzaileena, hazkunde azkarreko eragin ekonomikoa duena. Gaur egun, duela urte batzuk aurrerapen ikaragarriak eta imajinaezinak gertatzen ari dira. Hain zuzen, NLP aplikazio funtzionaleko eremu garrantzitsuenetako bat da. Adimen artifizialaren %50 baino gehiago Hizkuntzaren Prozesamendua dela kalkulatzen da.

Egiten diren lan askoren berezko zailtasuna gorabehera, Hizkuntza-teknologiaren egungo garapen-mailak duela urte gutxi pentsaezinak ziren aplikazio aurreratu asko ahalbidetzen ditu. Hizkuntza-Teknologia gure eguneroko bizitzan dago, nahiz eta ez garen horretaz jabetzen. Adibidez, informazio-bilatzaileen, gomendio-sistemen, laguntzaile birtualen, txat-en, testu-zuzentzaileen, testu-aurresaleen, itzulpen automatikoko sistemen, azpititulazio automatikoen, laburpen automatikoen, teknologia inklusiboaren eta abarren bidez. baita administrazioan ere, aplikazio-eremu bertikalen bidez, hala nola hezkuntza, osasuna, justizia, turismoa… Azken urteetan izan duen garapen azkarrak emaitza are harrigarriagoak ekarri ditu etorkizun hurbilean.

 

 

“Buenos días a todos y bienvenidos a la jornada sobre la transición digital multilingüe en l nueva economía de la lengua.

Quisiera agradecer el apoyo del Gobierno Vasco, concretamente a la Consejería de Cultura y al centro HiTZ de la Universidad del País Vasco. Especialmente, al  director del centro HiTZ Eneko Agirre, a la rectora Eva Ferreira y al consejero Bingen Zupiria.

Y agradecer a todos los que participan y asisten en esta jornada sobre la transición digital multilingüe en la nueva economía de la lengua.

Esta jornada se enmarca con el objetivo de dar respuesta y dar a conocer la potencialidad de la tecnología del lenguaje. Estamos asistiendo a una revolución de la inteligencia artificial en general y en particular del procesamiento del lenguaje natural, también conocido como tecnología del lenguaje que está penetrando en todos los ámbitos y en la mayor parte de los sectores de la sociedad. 

Permítanme que haga una breve reseña y presentación a la Sociedad Española para el Procesamiento para el Lenguaje Natural (SEPLN). La sociedad que viene vertebrando la investigación en España. Cuenta con una larga trayectoria, desde 1983. Es una comunidad  muy activa, sin ánimo de lucro y formada por socios numerarios, instituciones y empresas. Cuyo objetivo es promover y difundir todo tipo de actividades referentes a la investigación, a la enseñanza o formación y desarrollo en el ámbito del procesamiento del lenguaje natural, tanto a nivel nacional como internacional. Resaltar que el congreso SEPLN es el más antiguo de España en el ámbito de la informática, viene realizándose año tras año, de manera ininterrumpida, desde la fecha de creación en 1983, precisamente en esta ciudad de San Sebastián. La sociedad cuenta con un gran capital humano, una masa crítica importante, ya que agrupa a investigadores de alto prestigio y grupos de investigación muy relevantes e internacionalizados que constituyen prácticamente toda la comunidad en Tecnología del Lenguaje, no sólo en España, también es un referente en Iberoamérica.

Centrándonos en el objeto de la jornada, quisiera mencionar que el lenguaje  natural es asombroso. Sin esfuerzo podemos preguntar a un desconocido cómo encontrar una cafetería o un lugar para comer más cercano. Podemos compartir nuestras experiencias, conocimientos, etc. El lenguaje es la forma más común y versátil para transmitir y acceder a la información. Usamos el lenguaje, como nuestro medio natural de comunicación, para codificar, almacenar, transmitir, compartir y manipular información. De hecho, la mayor parte de la información digital disponible es información no estructurada en forma de documentos (escritos o hablados) en múltiples idiomas, lo que representa un desafío para cualquier organización que quiera explotar y procesar esta información. Ya que no es trivial procesar la información digital no estructurada (texto y voz), ya que está sujeta a múltiples interpretaciones (ambigüedad), falta de conocimiento sobre el contexto y el mundo, y su complejidad intrínseca. La Tecnología del Lenguaje (TL) que se ocupa de estudiar y desarrollar sistemas capaces de procesar lenguaje humano, ha desarrollado a través de los años diferentes métodos para hacer explícita la información contenida en los textos y relacionarla con la realidad que describen.

Por lo tanto, el lenguaje es y debe estar en el centro de nuestros esfuerzos para desarrollar la Inteligencia Artificial, y viceversa. De hecho, actualmente, la Tecnología del Lenguaje es posiblemente el campo más innovador de la Inteligencia Artificial con un impacto económico de crecimiento acelerado. Actualmente estamos asistiendo a unos avances impresionantes e inimaginables hace unos años. De hecho, el PLN es una de las áreas de aplicación funcional más importantes. Se calcula que más del 50% de la inteligencia artificial es PLN. 

A pesar de la dificultad inherente de muchas de las tareas que se realizan, el grado de desarrollo actual de la TL permite ya muchas aplicaciones avanzadas impensables hace pocos años. La TL está presente en nuestra vida diaria, aunque no seamos conscientes de ello. Por ejemplo, a través de buscadores de información, sistemas de recomendación, asistentes virtuales, chatbots, correctores de texto, predictores de texto, sistemas de traducción automática, subtitulación automática, resúmenes automáticos, tecnología inclusiva, etc. así como, en la administración, a través de verticales como educación, sanidad, justicia, turismo… Su rápido desarrollo en los últimos años augura resultados aún más sorprendentes en un futuro muy cercano.

Desafortunadamente, tal y como demuestran los resultados del proyecto European Language Equality, este notable progreso tecnológico no se desarrolla por igual en todas las lenguas. Existe una distancia abismal entre ellas. Es una oportunidad la que tenemos con el multilingüismo, ya que se estima que la mitad de la población es bilingüe. Como ejemplo, el PLN atendió al 50% de la población que usa más de un idioma a la vez. En este contexto, el objetivo de esta jornada es dar respuesta a los siguientes retos:

  • Cómo hacer con éxito la transición digital multilingüe; cómo garantizar la pervivencia digital de nuestras lenguas y culturas.

  • Cómo rentabilizar socioeconómicamente el multilingüismo: innovación, servicios, productos y nuevos modelos de negocio.

Quisiera hacer mención muy brevemente al PERTE sobre la nueva economía de la lengua, aprobado en marzo por el gobierno y que nos acompañan en esta jornada la comisionada y su director, y a los que agradezco que hayan aceptado nuestra invitación. Consideramos el PERTE un acierto, es necesario aunque no suficiente, para llevar a las lenguas cooficiales a un estado de madurez tecnológica que las sitúe a la vanguardia de la sociedad y economía digitales, y que esto permita a su vez el desarrollo de una industria que pueda liderar incluso a escala mundial los servicios, productos y aplicaciones basados en TL, en particular en español. La TL está contribuyendo al desarrollo de sociedades digitales inclusivas, y son útiles para la transformación digital y responder a los desafíos sociales (multilingüismo, accesibilidad, transparencia y equidad).

Tenemos una ventana de oportunidad que tendrá, en todo caso, una duración temporal limitada. En el horizonte del 2025 deberían ser evidentes los resultados del PERTE como plan de choque para la maduración tecnológica del español y las lenguas cooficiales del estado. De otro modo se perderá, quizás definitivamente, la oportunidad de que España lidere la economía alrededor de la TL en sus lenguas.

Como se pondrá de manifiesto en la jornada, las iniciativas de diferentes gobiernos autonómicos en este sentido, como son las iniciativas públicas con lengua propia, las del País Vasco, Galicia y Cataluña, concretamente con el Gaitu, Nós y Aina respectivamente. Así como al Perte al que ya he hecho referencia a nivel estatal.

Se deben de adoptar decididas políticas científicas para su correcto y eficiente despliegue, y contribuir con ello al progreso de la ciencia, la sociedad y el conocimiento. Es por tanto necesario que desde la SEPLN se influya en la equidad de las lenguas cooficiales y se involucre a los investigadores y a la academia (universidades), ya que contamos con centros de investigación de diferentes universidades relevantes y competitivos en PLN, como los que colaboran en esta jornada (Hitz, Citius, CEATIC, CENID y BSC),  así como grupos de investigación por todo el territorio estatal.

Esperemos sacar el máximo provecho a esta jornada, corta pero intensa, a través de mesas redondas se dará respuesta a la situación del multilingüismo en los ámbitos de industria, investigación y formación en PLN (TLH).”

]]>
https://www.unibertsitatea.net/blogak/ixa/2022/06/01/alfonso-urena-hizkuntzaren-ekonomia-berriko-jardunaldian-2022-06-01/feed/ 0
Eva Ferreira, Hizkuntzaren ekonomia berriko jardunaldian (2022-06-01) https://www.unibertsitatea.net/blogak/ixa/2022/06/01/eva-ferreira-hizkuntzaren-ekonomia-berriko-jardunaldian-2022-06-01/ https://www.unibertsitatea.net/blogak/ixa/2022/06/01/eva-ferreira-hizkuntzaren-ekonomia-berriko-jardunaldian-2022-06-01/#respond Wed, 01 Jun 2022 09:06:30 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=3092
Eva Ferreira, Bingen Zupiria, eta Allfonso Ureña.

Hizkuntzaren ekonomia berriko trantsizio digital eleaniztunari buruzko jardunaldia antolatu dugu Donostiako Miramar jauregian. Galdera hauei erantzuteko asmoz:

  • Nola egin arrakastaz trantsizio digital eleaniztuna; nola bermatu gure hizkuntzen eta kulturen iraupen digitala?
  • Nola bihurtu sozioekonomikoki errentagarri eleaniztasuna: berrikuntza, zerbitzuak, produktuak eta negozio-eredu berriak?

SEPLN Hizkuntza Naturala Prozesatzeko Espainiako Elkarteak, Eusko Jaurlaritzako Kultura Sailaren eta UPV/EHUko HiTZ zentroaren lartean antolatu dugu.

Hau da UPV/EHUko errektore Eva Ferreriraren hasierako interbentzioa:

“Kultura eta Hizkuntza Politika sailburu jauna; Comisionada para la Alianza por la Nueva Economía de la Lengua, Gobierno de España; Presidente de la Sociedad Española para el Procesamiento del Lenguaje Natural; HiTZ zentroko zuzendari jauna; autonomi erkidego ezberdinetako herri agintariok; jaun-andreok.

Euskal Herriko Unibertsitatearentzat oso pozgarria da hizkuntzaren ekonomia berriko trantsizio digital eleaniztunari buruzko jardunaldi honen antolaketan eta garapenean parte hartu izana.

Horregatik, eskerrak eman nahi dizkiot Kultura eta Hizkuntza Politikako Sailari jardunaldi hau sustatu eta babestu izanagatik. Eskerrik asko sailburu jauna gure unibertsitate publikoan jarri duzun, jarri duzuen, konfiantzagatik. Pozgarria eta atsegina zait gaur zuekin Miramar Jauregi honetan egotea. Egoitza hau unibertsitateko jarduera akademikoarekin estuki lotua baitago.

Hizkuntza gizateriak duen tresnarik konplexuena eta bereziena da. Maiz errepikatu denez, hizkuntzak egiten gaitu, nolabait, gizaki.

Hizkuntza tresna konplexua da bere egituran, noski, baina are konplexuagoa kultura aniztasunean, hizkuntza asko izanik. Hizkuntzek kultura-tapiz aberatsa ehundu dute historian zehar, baina tapiz horrek are gehiago zaildu ditu giza harremanak.

(…)

El lenguaje es, en efecto, la herramienta intelectual más sofisticada que ha ideado el ser humano. Pero a esa complejidad se le une la complejidad añadida del multilingüismo como producto de la diversidad de pueblos y culturas.

Por ello, el lenguaje se ha convertido en un objeto de atracción para la tecnología y para su desarrollo, desde una perspectiva multidisciplinar.

Ese campo de trabajo, tan vasto y también tan ambicioso, se sitúa en eso que denominamos “conocimiento de frontera”. La tecnología del lenguaje constituye una auténtica vanguardia del conocimiento dirigida a explorar la inteligencia humana; a explotar los recursos textuales y orales que esta ha desarrollado; y a indagar en formas cada vez más ambiciosas y sugestivas de inteligencia artificial.

En ese sentido, la tecnología del lenguaje encara verdaderos desafíos. Uno de ellos es el desarrollo cada vez más sofisticado de tecnologías dirigidas a actuar en un entorno multilingüe. Nadie puede negar que el multilingüismo es una riqueza para el patrimonio cultural de la humanidad. Pero ahora, en el contexto de nuestro tiempo, el multilingüismo no es una circunstancia localizada en el tiempo y en el espacio, sino la consecuencia lógica de una sociedad global. Y las tecnologías del lenguaje son cada vez más eficaces a la hora de salvar los inconvenientes que suscita el uso de lenguas incomprensibles entre sí.

Los desafíos son numerosos. Uno de ellos, la exploración de un nuevo espacio de actividad económica, basada en nuevos servicios para nuevas necesidades, dentro de un contexto global.

Sin embargo, hay más: a menudo se habla de la economía global pero no tanto de su irremediable consecuencia: una cultura global. Las culturas, y con ellas, las lenguas, ya no habitan espacios separados, con puntuales sectores de convivencia. Ahora, las culturas y las lenguas se superponen, de diversas maneras, en un mundo donde las fronteras físicas ya han desaparecido y las fronteras políticas, en buena medida, también.

Por ello, deben construirse puentes entre las lenguas y las nuevas tecnologías son determinantes en esa tarea. Ese es, además, un condicionamiento fundamental para conseguir otro objetivo: que las lenguas sobrevivan, que sigan cumpliendo su decisiva función de comunicación en sus comunidades de origen y que también permitan entrar en contacto directo -e inmediato- con otras lenguas y culturas.

Los temas a abordar esta jornada son muy ambiciosos y requieren la colaboración de la universidad, la administración pública y la empresa. Creo que, desde la Universidad del País Vasco, la aportación que podemos hacer es inmejorable: HiTZ, centro vasco de tecnología del lenguaje, un proyecto en el que se integran grupos de investigación tan relevantes como AHOLAB (que ha participado en proyectos de reconocimiento de voz, conversión de texto a voz e identificación de locutor) e IXA Taldea (que trabaja en el desarrollo de recursos y herramientas para el tratamiento del euskera, castellano o inglés).

El centro de investigación HiTZ es hoy día una referencia a nivel internacional en su especialidad y creo que hay un reconocimiento implícito a esa realidad en la elección de nuestra universidad para esta jornada de trabajo.

Uste dut hizkuntzaren teknologia aliatu berria dela hizkuntza gutxituen biziraupenerako, eta ziur nago lan-eremu horrek etorkizunerako aukera berriak ekarriko dituela.

Nire aldetik, besterik ez. Lanaldi emankorra opa dizuet eta mila esker zuen arretagatik.

]]>
https://www.unibertsitatea.net/blogak/ixa/2022/06/01/eva-ferreira-hizkuntzaren-ekonomia-berriko-jardunaldian-2022-06-01/feed/ 0
LINGUATEC proiektuko emaitzak META-FORUM 2021en (2021-11-15) https://www.unibertsitatea.net/blogak/ixa/2021/11/15/linguatec-proiektuko-emaitzak-meta-forum-2021en-2021-11-15/ https://www.unibertsitatea.net/blogak/ixa/2021/11/15/linguatec-proiektuko-emaitzak-meta-forum-2021en-2021-11-15/#comments Mon, 15 Nov 2021 12:57:45 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=3039

LINGUATEC proiektu europarrean lortutako emaitzak aurkeztu ditugu gaur poster batean META-FORUM 2021 biltzarrean. Proiektuaren xedea okzitanieraren, aragoieraren eta euskararen digitalizazio-maila hobetzea zen, eta bete-betean lortu dugu. Hauek izan dira emaitzak:

EUSKARA

INTELE kongresuko posterra (CC-BY-SA)

ARAGOIERA

LINGUATEC eskuinaldean erdian, poster-saio “telematikoan”

OKZITANIERA

BALIABIDE ELEANIZTUNAK

]]>
https://www.unibertsitatea.net/blogak/ixa/2021/11/15/linguatec-proiektuko-emaitzak-meta-forum-2021en-2021-11-15/feed/ 2
Linguatec AI Bikaintasun-Sarea (2021-06-18) https://www.unibertsitatea.net/blogak/ixa/2021/10/08/linguatec-ai-bikaintasun-sarea-2021-06-18/ https://www.unibertsitatea.net/blogak/ixa/2021/10/08/linguatec-ai-bikaintasun-sarea-2021-06-18/#comments Fri, 08 Oct 2021 12:09:32 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=3028

Bukatu da aurten LINGUATEC proiektu europarra. Proeiktuaren xedea okzitanieraren, aragoieraren eta euskararen digitalizazio-maila hobetzea izan da, eta neurri handi batean lortu dugu helburua.

  • 2021eko maiatzeko workshopean emaitza zientifikoak konpartitu genituen komunitate akademikoarekin,
  • Ekaineko biltzar publikoan Linguatec AI Bikaintasun-Sarea sortu genuen proiektuko kideen artean, 2018-2021 urteetan egin dugun lankidetza-lan eredugarriari jarraipena emateko.
Linguatec sarearen erakunde sortzaileen ordezkariak: Elhuyar fundazioa, Aragoiko Gobernua, Okzitaniako Tolosako CRNS goi mailako ikerketa zentroa, Euskaltzaindia, Lo Congrés okzitanieraren akademia eta EHUko Ixa taldea. (Naiz, 2021-06-19)

Sare berria sortzeko adierazpena lau hizkuntzatan idatzi genuen (espainieraz, frantsesez, okzitanieraz eta euskaraz, LINGUATEC-AI_ES-EU-FR-OC.pdf). Hau da euskarazko bertsioa:

 

LINGUATEC AI BIKAINTASUN-SAREA

Adimen Artifiziala Hizkuntzan Mugaz Gaindiko Bikaintasun Sarea eratzea (Pirinioez gaindiko hizkuntza-azpiegitura eraikitzeko lankidetza teknologikoa)

Pirinioetako Lan Elkartearen lurraldea eraikitzen ari diren mugaz gaindiko proiektua da, eta 15 milioi herritarrek baino gehiagok partekatzen dituzte 6 hizkuntza eta horien tokiko barietateak. Eleaniztasuna gure lurraldeko aktiborik handienetako bat da, eta erronka garrantzitsuenetako bat ere bada, kulturaren eta ekonomiaren ikuspegitik kohesionatutako lurralde bat sortzeko. Gauza bera gertatzen da Europan, non hogeita lau hizkuntza ofizial eta 60 hizkuntza gutxitu baino gehiago osatzen duten eremu eleaniztun aberatsa baita; garai batean, eleaniztasuna komunikazioa eta informazioaren zirkulazio librea zailtzen zituzten hizkuntza-oztopo gisa ikusi ziren.

Adimen artifiziala hizkuntza eguneroko produktu digital askotan erabiltzen da, gehienak hizkuntzaz baliatzen baitira. Komunikazio mugikorrek, sare sozialek, laguntzaile adimendunek eta ahotsean oinarritutako interfazeek herritarrak, enpresak eta administrazio publikoak mundu digitalean elkarreraginean aritzeko modua aldatzen ari dira

Hizkuntza-teknologiek eraginkortasunez laguntzen dute Europako herritar guztien (eta Pirinioetako Lan Elkartearen lurraldearen) arteko berdintasuna lortzen eguneroko bizitzan, edozein dela ere hitz egiten duten hizkuntza. Nahiz eta hizkuntza gutxituek asko duten irabazteko hizkuntza-teknologiekin, egoera teknologiko ahula dute abiapuntu; izan ere, hizkuntza horiek digitalki garatzeko behar diren tresna eta baliabideak oso urriak dira, eta, kasu batzuetan, ez dira existitzen. 2018ko irailaren 11n Europako Parlamentuak onartutako ebazpenean (“On language equality in the digital age” 2018/2028(INI)) argiki egiaztatu du Europako hizkuntzen artean desoreka dagoela hizkuntzaren teknologien barruan, eta ekintzarako deia egin du, hizkuntzen arteko arrakala horiek lehenbailehen gainditzeko.

Hizkuntza baten garapena, eta beraz, hizkuntza horretatik elikatzen den kultura, erabat loturik dago hizkuntza horrek ingurune moderno eta aldakorretan, hala nola mundu digitalean funtzionatzeko duen gaitasunarekin. Hala, hizkuntza- eta kultura-aniztasuna estu lotuta dago mundu digitalean hizkuntza batek dituen gaitasun eta baliabideekin, hau da, gure kasuan mugaz gaindiko hizkuntza-azpiegitura sortzearekin. Hori dela eta, oso garrantzitsua da hizkuntza-oztopoak gainditzea eta, hartara, Pirinioetako Lan Elkartearen lurraldeko hizkuntzak indartzea, lurraldeak duen balio ekonomiko, kultural eta linguistikoa osorik bultzatu ahal izateko.

Lurraldeko hizkuntza guztientzat euskarri teknologiko egokia bermatzeak enplegua sortuko dugu, hazkuntza, aukerak, kulturarteko harremanak eta nazioarteko erreferentzialtasuna.

Era berean, funtsezkoa da ingurune digitaleko hizkuntza-oztopoak gainditzea, funtsezkoa baita gizarte inklusiborako eta aniztasunari batasuna eta kohesioa emateko urte askoan.

Linguatec AI Bikaintasun Sarearen xedea

Adimen Artifiziala Hizkuntza Mugaz Gaindiko Bikaintasun Sarea sortzea, lankidetza teknologikoaren bidez Pirinioez gaindiko hizkuntza-azpiegitura eraikitzen laguntzeko.

Helburuak

1. LINGUATEC bezalako mugaz gaindiko proiektuen beharra balioan jarri eta transmititzea, gure lurraldearen aberastasun eleaniztunak balio ekonomiko, turistiko eta kulturala sortzen baitu. Hau da, hizkuntza-hesia gainditzea eta ahaleginak batzea gure kultura- eta hizkuntza-aberastasuna motor ekonomiko gisa aprobetxatzeko.

2. Agenda estrategiko baten oinarriak eta ibilbide-orri bat ezartzea, hizkuntza-berdintasun digitala errealitate izan dadin Pirinioetako Lan Elkartearen lurraldean 2030ean.

3. Euskararen, katalanaren, aragoieraren eta okzitanieraren arteko lankidetza estua abiaraztea, guztiek oinarri teknologiko nahikoa izan dezaten, eta, hartara, pertsona bakoitzak bere hizkuntzan eroso parte har dezan mundu digitalean.

4. Adimen artifizialak hizkuntza eskaintzen dizkigun aukerak eta ahalmenak gizarteratzea, lurralde kohesionatua, integratzailea, eleaniztuna eta adimenduna lortzeko.

5. Adimen artifizialean azken belaunaldiko ezagutza eta teknologia sortzea, enpresek, erakundeek eta gizarte-erakundeek teknologiaren ahalmena aprobetxa dezaten Pirinioetako Lan Elkartearen lurraldearen garapen ekonomiko, sozial eta instituzionalerako.

6. Beste lurralde eleaniztun batzuetan, Europan zein mundu osoan, Pirinioetako Lan Elkartearen lurraldean lortutako lorpenak zabaltzea, esperientzia, prestakuntza, aholkularitza eta teknologia eskainiz.

7. Pirinioetako Lan Elkartearen lurraldea erreferentzia garrantzitsu bihurtzea hizkuntza-teknologietan baliabide urriak dituzten hizkuntzentzat eta haren garapen digitalean aurrera egin nahi duten hizkuntzentzat.

]]>
https://www.unibertsitatea.net/blogak/ixa/2021/10/08/linguatec-ai-bikaintasun-sarea-2021-06-18/feed/ 1
Linguatec biltzar publikoa: Adimen artifiziala, azpiegitura linguistikoak eta mugaz gaindiko lankidetza (online, 2021-06-17 eta 18) https://www.unibertsitatea.net/blogak/ixa/2021/06/14/biltzar-publikoa-adimen-artifiziala-eta-mugaz-gaindiko-lankidetza-online-2021-06-17-eta-18/ https://www.unibertsitatea.net/blogak/ixa/2021/06/14/biltzar-publikoa-adimen-artifiziala-eta-mugaz-gaindiko-lankidetza-online-2021-06-17-eta-18/#comments Mon, 14 Jun 2021 12:15:42 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=3012

Bukatzen da. Okzitanieraren, aragoieraren eta euskararen  digitalizazio-maila hobetzea izan da LINGUATEC proiektu europarraren helburua. 2021eko maiatzaren 12an workshop batean konpartitu genuen komunitate akademikoarekin. Orain gizarte osoari gonbitea luzatzen diogu.

Ezagutu nahi dituzu Linguatec proiektuan sortu ditugun tresnak eta baliabideak?

Ostegunean, ekainak 17, Pauen
eta ostiralean, ekainak 18, Donostian.

Interesa duten guztientzat, proiektuaren barruan egindako lana zabaltzeko.
Biltzarra jende guztiarentzat dago irekita, baina erregistratu egin behar da (MATRIKULATU)

Informazio gehiago: https://www.uik.eus/sites/default/files/linguatec_eu_-_0806202

MUGAZ GAINDIKO BILTZARRA
Adimen artifiziala eta mugaz gaindiko lankidetza: azpiegitura linguistiko, adimendun eta irisgarri baten bidean


Ekainaren 17a, Paue.

  • Toki Fisikoa: Complexe de la République (700 aretoa)
  • Ordutegia: 9:00etatik 15:00etara.
  • Formatua:Aurrez aurrekoa (erakundeak eta prentsa) eta streaming bidez emango da Facebook-en eta Youtube-n. Ekitaldiaren grabazioa Interneten jarriko da ikusgai, gero.

PROGRAMA

10h – Irekiera

9:00 –HASIERA (15 min)

  • Gilabèrt Mercadièr, Okzitanieraren Kongresu Iraunkorreko lehendakaria.
  • Jon Abril Olaetxea, Elhuyarreko koordinatzaile nagusia. POCTEFA LINGUATEC proiektuko taldeburua da Elhuyar.

9:15 –TEKNOPOLISEN BIDEO-EMANALDIA (15 min)

9:30 –MAHAI-INGURUAK
Moderatzailea: Marius Blénet, kazetaria

9:30 –1. mahai-ingurua: “Europako eta mugaz gaindiko lankidetza, Pirinioetako hizkuntzen garapen digitalerako esparru pribilegiatua” (1:30)

  • Charline Claveau, Okzitanieraren Bulego Publikoko lehendakaria.
  • Antton Curutcharry, Euskararen Bulego Publikoko lehendakaria.
  • José Ignacio López Susín, Aragoiko Gobernuko Hizkuntza Politikako zuzendari nagusia

10:45 KAFEA HARTZEKO ATSEDENALDIA

11:00 ENPRESEN ETA ERAKUNDEEN ARTEKO HITZARMENA SINATZEA(25 minutu), bazkideen eta prentsaren aurrean

11:30 2. mahaiingurua: “Pirinioetan mugaz gaindiko hizkuntzaazpiegitura bat eraikitzekoadimen artifizialeko bikaintasunsare bat lortzeko bidean” (1,5 h)

  • Josu Aztiria Urtaran, Elhuyar Fundazioa.
  • Benaset Dazéas, Okzitanieraren Kongresu Iraunkorra.
  • José Ignacio López Susín, Aragoiko Gobernua.
  • Battittu Coyos, Euskaltzaindia.
  • Kepa Sarasola, IXA Euskal Herriko Unibertsitatea.
  • Myriam Bras, CLLEERSS Tolouseko UnibertsitateaJean Jaurés/CNRS.

13:00 BAZKALTZEKO ETENALDIA (1 h).

14:00 OKZITANIERARAKO GARATUTAKO TRESNAK TRANSFERITZEKO TAILERRA (45 min).
Moderatzailea: Benaset Dazéas, Okzitanieraren Kongresu Iraunkorreko zuzendaria.

  • Votz, okzitanieraren ahotssintesia:Michaël Barret (15 min).
  • Okzitanierarako itzultzaile automatikoa:Aure Séguier (15 min).
  • Appak eta zerbitzu berritzaileak:Itziar Cortes Etxabe (15 min).

Ekainaren 18a, Donostia.

  • Tokia: Miramar jauregia
  • Ordutegia: 9:00etatik 15:00etara.
  • Formatua:Workshopa aurrez aurre egingo da, eta ZOOM bidez zuzenean partehartzeko aukera ere izango da.

PROGRAMA

9:30 HASIERA (30 min)

  • Jon Abril Olaetxea, Elhuyarreko koordinatzaile nagusia. POCTEFA LINGUATEC proiektuko taldeburua da Elhuyar.
  • Junkal Gutierrez, EHUkoEuskara, Kultura eta Nazioartekotzearen arloko errektoreordea.
  • Garbiñe Mendizabal, Gipuzkoako Foru Aldundiko Hizkuntza Berdintasuneko zuzendaria.

10:00 Mahaiingurua: “Hizkuntzaazpiegituren beharra mugaz gaindiko lankidetza areagotzeko” (1,5 h) Moderatzailea: Josu Aztiria, Elhuyarreko Adimen Artifiziala eta Hizkuntza Teknologien Unitateko koordinatzailea eta LINGUATEC proiektuaren zuzendaria

  • Mikel Anton, Eusko Jaurlaritzako Europako Gaietarako zuzendaria
  • Pello Pellejero, Nafarroako Gobernuko Europako Ekintzaren, Eskualdeekiko Lankidetzaren eta Kanpoko Herritarren Zerbitzua
  • José Ignacio López Susín, Aragoiko Gobernuko Hizkuntza Politikako zuzendari nagusiaArola Urdangarin, Akitania BerriaEuskadiNafarroa Euroeskualdearen zuzendaria
  • JeanLouis Valls, CTPPOCTEFAko zuzendaria

11:30 KAFEA HARTZEKO ATSEDENALDIA

Prentsa: Mugaz gaindiko hizkuntzaazpiegitura bat eraikitzeko adimen artifizialeko bikaintasunsarearen aurkezpena.

  • Eneko Goia, Donostiako alkatea
  • Partzuergoaren bazkideek sorreramanifestua irakurri eta sinatzea.12:00 Hizkuntzen arteko lankidetza teknologikoaren aukerak eta erronkak(1,5 h)

12:00 European Language initiatives 1(45 min)
Moderatzailea: German Rigau, Hitz Zentroa

  • Georg Rhem, European Language Grid (20 min)
  • Andy Way, European Language Equality (20 min)
  • Galderen txanda (5 min)

12:45 European Language initiatives 2(45 min)
Moderatzailea: Klara Ceberio, Elhuyar

Claudia Soria, The Digital Language Diversity Project (20 min)

Benaset Dazeas, Congrès permanent de la lenga occitana (20 min)

Galderen txanda (5 min)

13:30 ATSEDENALDIA

14:00 LINGUATEC PROIEKTUAREN APLIKAZIOEN ERAKUSTALDITAILERRA (1 h).

  • Itzulpen automatikoa: APPa, tresnabarra, CMS plugina
  • Ahotssintesirako plataformak eta aplikazioak (okzitaniera eta euskara)
  • APP eleaniztun eta irisgarriak
  • Ahotsezagutzea eta azpititulazio automatikoa
]]>
https://www.unibertsitatea.net/blogak/ixa/2021/06/14/biltzar-publikoa-adimen-artifiziala-eta-mugaz-gaindiko-lankidetza-online-2021-06-17-eta-18/feed/ 1
IKERGAZTEko sari berezia Joseba Fernandez de Landa-ri https://www.unibertsitatea.net/blogak/ixa/2021/06/11/ikergazte-kongresuko-sari-berezia-joseba-fernandez-de-landa-ri/ https://www.unibertsitatea.net/blogak/ixa/2021/06/11/ikergazte-kongresuko-sari-berezia-joseba-fernandez-de-landa-ri/#comments Fri, 11 Jun 2021 13:35:09 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=3005

Joseba Fernandez de Landak gaur Gasteizen bukatu den IkerGazte kongresuko sari berezia jaso du. Udalbiltzak eskaintzen du sari hori, Euskal Herriko garapenerako bereziki garrantzitsua den gaia lantzeagatik. Ingeniaritza eta Arkitektura alorrean egin du artikulu hori Josebak beste hiru Ixakiderekin: Iker García, Ander Salaberria, eta Jon Ander Campos,.

Joseba soziologoa da gizartearen kezkak nondik nora mugitzen diren aztertu nahi du. Bere tesian Twitterreko txioetan erabiltzen diren hitzak aztertzen ditu. urtez urte nola aldatzen diren miatzen du hizkuntza teknologia erabiliz. Ikergazte artikulu irabazle honetan Hizkuntzaren Prozesamenduak eskaintzen dituen teknika ez-gainbegiratuak erabili ditu euskarazko txioetan COVID-19aren pandemiak izan duen eragina aztertzeko.

Irakurri artikulu osoa, Kongresuko artikulu bilduman irakur dezakezu 137. orrialdean. Motibazio moduan hemen dituzu bertako irudi batzuk

  • Zeintzuk dira pandemia garaian erabileran hazkuntza nabarmena izan duten hitzek? Eta jaitsiera handiena jaso dituztenak? Logika dauka, ez da?
  • Zeintzuk dira txioetan  Covid hitzaren inguruan gehien erabili diren hitzak?

 

 

 

 

 

 

 

 

 

ZORIONAK Josebari eta bere zuzendaria den Rodrigo Agerriri!
Baita Iker, Jon Ander eta Ander laguntzaileei

]]>
https://www.unibertsitatea.net/blogak/ixa/2021/06/11/ikergazte-kongresuko-sari-berezia-joseba-fernandez-de-landa-ri/feed/ 1
Arantza Diaz de Ilarrazaren hitzaldia eta 5 artikulu IkerGazte kongresuan! https://www.unibertsitatea.net/blogak/ixa/2021/06/09/3000/ https://www.unibertsitatea.net/blogak/ixa/2021/06/09/3000/#respond Wed, 09 Jun 2021 19:36:04 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=3000

 

 

Gasteizen ikerlari gazteak biltzen dituen IkerGazte biltzarrean 5 artikulu aurkeztu dituzte Ixa-kideek. Parte hartze handia da hori.

Gainera Arantza Diaz de Ilarrazarena izan da hitzaldi gonbidatuetako bat:Hizkuntza teknologiaren bilakaera: IXA taldearen esperientzia. Erabili zientzia gure gizartearen alde.
Ixa tadearen 33 urteko jarduera azaldu du Arantzak.

Ikusi artikulu guztiak  informatikako komunikazioen LIBURUAN

  • (68) Erlazio-erauzketa testu klinikoetan hizkuntzaren prozesamenduaren bidez.
    Sergio Santana, Alicia Pérez, Arantza Casillas eta Maite Oronoz
  • (84) Ezeztapena identifikatzeko Murriztapen Gramatikako erregelak sentimenduen analisiaren testuinguruan.
    Jon Alkorta, Koldo Gojenola, X Arregi
  • (112) Unibertsitateko ikasleen laburpen-gaitasunaren azterketa eta testuaren egitura hierarkikoan oinarrituriko atzera elikadura automatikoa.
    Unai Atutxa.
  • (128) Twitterreko Euskal Komunitatearen Eduki Azterketa Pandemia Garaian.
    Joseba Fernandez de Landa, Iker Garcia, Ander Salaberria and Jon Ander Campos
  • (139) Itzulpen Automatikoko Sistemen Analisia: Genero Alborapenaren Kasua.
    Ander Salaberria, Jon Ander Campos, Iker Garcia and Joseba Fernandez de Landa

Informatika Fakultatetik beste bi artikulu ere aurkeztuko dira:

  • (42) Diseinuaren ezagutzaren biltzea software artefaktuetan; Produktu Lerroen Ingeniaritzan oinarritutako proposamena
    Xabier Garmendia, Oscar Díaz, Maider Azanza
  • (155)
    Mikel Iceta Tena, Iñaki Morlán Santacatalina and Jose Antonio Pascual Saiz
]]>
https://www.unibertsitatea.net/blogak/ixa/2021/06/09/3000/feed/ 0
Workshop: Pirinioetako hizkuntzak automatikoki prozesatzeko baliabideak eta tresnak (online, 2021-05-12) https://www.unibertsitatea.net/blogak/ixa/2021/04/30/workshop-pirinioetako-hizkuntzak-automatikoki-prozesatzeko-baliabideak-eta-tresnak-online-2021-05-12/ https://www.unibertsitatea.net/blogak/ixa/2021/04/30/workshop-pirinioetako-hizkuntzak-automatikoki-prozesatzeko-baliabideak-eta-tresnak-online-2021-05-12/#comments Fri, 30 Apr 2021 12:20:46 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=2975

INTELE bilkuran erakutsitako posterra (2020, CC-BY-SA)

Okzitanieraren, aragoieraren eta euskararen  digitalizazio-maila hobetzea izan da LINGUATEC proiektu europarraren helburua. Hainbat baliabide, tresna eta aplikazio linguistiko berritzaile garatu ditugu 2018tik hona. Proiektuak hizkuntzen arteko lankidetza teknologikoa ahalbidetu du.

Orain online workshop hau antolatu dugu. 2021eko maiatzaren 12an konpartituko dugu komunitate akademikoarekin.
Online izango da, aurkezpenak ingelesez, gaztelaniaz eta frantsesez, eta aldi bereko itzulpenak ingelesez, gaztelaniaz eta frantsesez.

Interesa duten ikertzaile guztientzat, proiektuaren barruan egindako lana zabaltzeko, baita euskararako eta okzitanierarako egindako aurrerapen batzuk aurkezteko ere.

Workshopa jende guztiarentzat dago irekita, baina erregistratu egin behar da (registration form)

Informazio gehiago: ixa.eus/events/linguatec

 

PROGRAMA

10h – Irekiera

10h15     Hitzaldi gonbidatuak: Katalanaren prozesamendua

    Lluis Padró (Universitat Politècnica de Catalunya)
    Morphological and Syntactic Resources in FreeLing
    Ingelesez – Aldibereko itzulpena espainieraz eta frantsesez

   Mariona Taulé (Universitat de Barcelona)
   AnCora: un corpus anotado a diferentes niveles lingüístico
AnCora hainbat hizkuntza-mailatan etiketatutako corpusa.
    Gaztelaniaz – Aldibereko itzulpena ingelesez eta frantsesez

11h15 — Atsenaldia

11h30 Aurkezpenak: Okzitanierarako eta euskararako corpus anotatuak

   Assaf Urieli, Joliciel
    Talismane, Jochre: automatic syntax analysis and OCR for under-resourced languages
    Ingelesez – Aldibereko itzulpena espainieraz eta frantsesez

   Aleksandra Miletic y Dejan Stosic, CLLE
    Mutualisation des ressources pour la création de treebanks : le cas du serbe et de l’occitan
    Frantsesez – Aldibereko itzulpena espainieraz eta frantsesez

    Ainara Estarrona (IXA, HiTZ, UPV/EHU)
    Construcción del corpus histórico en euskera
    Euskararen corpus historikoa eraikitzea
   Gaztelaniaz – Aldibereko itzulpena ingelesez eta frantsesez

13h — Bazkaltzeko etenaldia

14h30     Hitzaldi gonbidatua: Neurona-sareen erabilera

   Mans Hulden (University of Colorado)
   Neural Networks in Linguistic Research
    Ingelesez – Aldibereko itzulpena espainieraz eta frantsesez

15h30 Aurkezpena: Hizuntzaren prozesamendua

   Rodrigo Agerri (IXA, HITZ, UPV/EHU)
   Contextual lemmatization for inflected languages: statistical and deep-learning approaches
    Ingelesez – Aldibereko itzulpena espainieraz eta frantsesez

16h – Atsedenaldia

16h15 – Aurkezpenak: LINGUATEC proiektuaren emaitzak

    Myriam Bras, Aleksandra Miletic, Marianne Vergez-Couret, Clamença Poujade, Jean Sibille, Louise Esher, CLLE :
    Automatic processing of Occitan: construction of the first annotated corpora.
    Okzitaneraren prozesamendua: lehen corpus etiketatuaren eraikitzea.
    Okzitanierazko bideoa, azpitituluak beste hizkuntzetan.               

    Elhuyar
    Creation and improvement of Basque resources within the framework of Linguatec
    Euskarazko bideoa, azpitituluak beste hizkuntzetan. 

16h45 – Ondorioak
    Espainieraz eta frantsesez, itzulpen zerbitzurik gabe.   

]]>
https://www.unibertsitatea.net/blogak/ixa/2021/04/30/workshop-pirinioetako-hizkuntzak-automatikoki-prozesatzeko-baliabideak-eta-tresnak-online-2021-05-12/feed/ 3
Bost artikulu onartuta Association for Computational Linguistics kongresuan https://www.unibertsitatea.net/blogak/ixa/2020/05/05/bost-artikulu-onartuta-association-for-computational-linguistics-kongresuan/ https://www.unibertsitatea.net/blogak/ixa/2020/05/05/bost-artikulu-onartuta-association-for-computational-linguistics-kongresuan/#comments Tue, 05 May 2020 07:26:23 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=2812 Aurten ospatuko den Association for Computational Linguistics (ACL) kongresuko 58. edizioan Ixa taldeko kideek kolaboratzaileekin batera bost artikulu aurkeztuko dituzte. ACL kongresua Hizkuntzaren Prozesamenduko kongresurik garrantzitsuenetakoa da eta uztailean Seattlen egin behar zen, baina aurten sarean izango da.

Hemen duzue ixakidei eta kolaboratzeei onartutako artikuluei buruzko informazioa:

Selecting Backtranslated Data from Multiple Sources for improved Neural Machine Translation (Xabier Soto, Dimitar Shterionov, Alberto Poncelas, Andy Way): Atzeranzko itzulpen sistema anitzen bitartez itzulitako datuek eu-es eta de-en domeinu klinikoko Itzulpen Automatiko Neuronaleko sistemetan duten eragina aztertzen dugu, eta Datu Hautaketa (DH) erabiltzen dugu corpus sintetikoa optimizatzeko. Ondoren, DHren irteera birkalkulatzen dugu atzeranzko itzulpena egiteko erabilitako sistemen kalitatea eta sortutako corpora sintetikoen aniztasun lexikoa kontuan hartuz.

On the Cross-lingual Transferability of Monolingual Representations (Mikel Artetxe, Sebastian Ruder, Dani Yogatama): BERT eredu elebakar bat maila lexikoan beste hizkuntzetara transferi daitekeela erakusten dugu, BERT eleaniztunaren inguruko aurreko hipotesiak zalantzan jartzen dituena.

A Call for More Rigor in Unsupervised Cross-lingual Learning (Mikel Artetxe, Sebastian Ruder, Dani Yogatama, Gorka Labaka, Eneko Agirre): Iritzi-artikulu honetan ikasketa eleaniztun gainbegiratu gabearen motibazio, definizio, hurbilpen eta metodologia berrikusten ditugu, eta euretako bakoitzean zorrotzago jokatzeko deia egiten dugu.

DoQA – Accessing Domain-Specific FAQs via Conversational QA (Jon Ander Campos, Arantxa Otegi, Aitor Soroa, Jan Deriu, Mark Cieliebak, Eneko Agirre): DoQA datu-multzoa aurkezten dugu, FAQetako informazioa elkarrizketa bidez atzitzeko balio duena. 2.437 elkarrizketa ditu 3 domeinu desberdinetan: sukaldaritza, bidaiak eta filmak.

A Methodology for Creating Question Answering Corpora Using Inverse Data Annotation (Jan Deriu, Katsiaryna Mlynchyk, Philippe Schläpfer, Alvaro Rodrigo, Dirk von Grünigen, Nicolas Kaiser, Kurt Stockinger, Eneko Agirre, Mark Cieliebak): Datu baseetako informazioa hizkuntzaren bidez atzitzeko entrenamentu datu-multzoak behar dira. Artikulu honetan halako datu-multzoak sortzeko metodologia berria proposatzen dugu, giza-anotazio abiadura hiru aldiz hobetzen duena aurreko metodoekin konparatuta. Gure esperimentuek erakusten dute kalitate oneko datu-multzoa dela, eta asmatu dugun token alineazioak emaitzak hobetzeko balio duela.

Zorionak guztiei!

 

]]>
https://www.unibertsitatea.net/blogak/ixa/2020/05/05/bost-artikulu-onartuta-association-for-computational-linguistics-kongresuan/feed/ 1
‘Humanitate digitalak’ jardunaldia (Bilbo, 2019-06-20) https://www.unibertsitatea.net/blogak/ixa/2019/06/06/2738/ https://www.unibertsitatea.net/blogak/ixa/2019/06/06/2738/#respond Thu, 06 Jun 2019 11:05:51 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=2738 Humanitate Digitalak garrantzitsuak dira Ixa taldean, aspaldi gabiltza Clarin-Centre-K erakundearekin lankidetzan. Testuak analizatzen laguntzeko (Analiza) eta laburtzeko (Compress eus) tresnak eskaintzen ditugu sarean. Gainera, sortu berri dugun HiTZ zentroko 8 ikerlerroetako bat da hau:  Humanitate  Digitalak eta Hezkuntza

Humanitate digitalen gaia aukeratu du UEUk Udako Ikastaroen hasierako jardunaldirako. Ixa Taldeko Mikel Iruskieta eta Iñaki Alegria antolatzaile dira, Rodrigo Agerri eta Montse Maritxalar hizlari.
Doakoa da baina izena eman behar da, parte hartu nahi baduzu…

Gaia Humanitate Digitalak izanda, aukerak, erakundeek jokatu behar dituzten rol berriak eta elkarlana aztertuko dira bertan. Digitalizazioak eta Big Data-k paradigma-aldaketa ekarri dute humanitateen arlora. Euskarazko dokumentuen digitalizazio masiboa, sare sozialen eztanda eta hizkuntza-teknologiaren arrakasta dira erroka honen hiru katalizadoreak. Nola eragiten du digitalizazioak humanitateen ikerketan? Ze aukera berri zabaltzen zaizkigu? Historian? Hezkuntzan? Hizkuntzalaritzan? Soziologian? Kazetaritzan? Zuzenbidean? Eta diziplinartekotasunean?

EGUNA: Ekainak 20, osteguna
TOKIA: Bilbo (Euskaltzaindiaren egoitza Plaza Barrian)
ORDUA: 9:30etatik aurrera
GAIA: Humanitate digitalak: aukerak, erakundeek jokatu behar duten rol berriak eta elkarlana.
PROGRAMA:

9:00-9:30 Harrera eta dokumentazio banaketa.
9.30-9:45 Ongi etorria eta aurkezpena.
09:45-10:15 HITZALDIA: Humanitate Digitalak (HD). Sarrera, digitalizazioaren aukerak eta erronkak
…………………Rodrigo Agerri (UPV/EHU, IXA taldea)
10.15-11.00: MAHAI-INGURUA: Digitalizazioa eta Hezkuntza.
…………………Montse Maritxalar (UPV/EHU, Ixa, UEU)
…………………Joseba Abaitua (DU)
…………………Xabier Mujika (Berritzegune Nagusia)
…………………Moderatzailea: Mikel Iruskieta (UPV/EHU)
11:00-11:30 – Atsedenaldia
11.30-12.15: MAHAI-INGURUA: Hizkuntza eta e-Humanitateak.
…………………Dorota Krajewska (Aziti Bihia taldea, UPV/EHU)
…………………Asier Sarasua (Ahotsak.eus, CodeSyntax)
…………………Moderatzailea: Iñaki Alegria (UPV/EHU, UEU)
12.15-13.00 MAHAI-INGURUA: Zientzia sozialak eta komunikazioa.
…………………Joxean Apeztegia (Berria)
…………………Julen Orbegozo Terradillos (UPV/EHU)
…………………Moderatzailea: Xabier Landabidea (DU)
13.00-13.30 HITZALDIA: CLARIN Europako sarea: eHumanitateak eta zientzia sozialak lankidetzarako behar duten hizkuntza azpiegiturak sortzen.
…………………Mikel Iruskieta /UPV/EHU)
13.30: Ondorioak.
…………………Antolatzaileak: Mikel Iruskieta, Xabier Landabidea eta Iñaki Alegria


Humanitate  Digitalak garrantzitsuak dira Ixa taldean, sortu berri dugun HiTZ zentroko 8 ikerlerroetako bat da: Humanitate  Digitalak eta Hezkuntza

 

 

 

 

]]>
https://www.unibertsitatea.net/blogak/ixa/2019/06/06/2738/feed/ 0