Master – Hizkuntza-teknologiak, Ixa Taldearen bloga https://www.unibertsitatea.net/blogak/ixa IXA taldea. Hizkuntzaren prozesamendua Wed, 31 May 2023 21:32:01 +0000 eu hourly 1 https://wordpress.org/?v=4.9.23 https://www.unibertsitatea.net/blogak/ixa/files/2018/10/ixa.jpg Master – Hizkuntza-teknologiak, Ixa Taldearen bloga https://www.unibertsitatea.net/blogak/ixa 32 32 HAP/LAP masterreko tesiak (2020-09-21 eta 22an) https://www.unibertsitatea.net/blogak/ixa/2020/09/16/hap-lap-masterreko-tesiak-2020-09-21-eta-22an/ https://www.unibertsitatea.net/blogak/ixa/2020/09/16/hap-lap-masterreko-tesiak-2020-09-21-eta-22an/#comments Wed, 16 Sep 2020 09:03:35 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=2879 Hizkuntzaren Azterketa eta Prozesamendua HAP-LAP masterrean zazpi master-tesi aurkeztuko dira astelehen eta asteartean, irailak 21 eta 22.

Horietako bat euskaraz aurkeztuko da asteartean, hilak 22, 15:00etan. Mari Susperregiren lanaren izenburua hau da: “Muturretik muturrerako informazio erauzketa eleaniztuna eta hizkuntzen arteko terminoen lerrokatze neuronala”.
Hau da lanak aurkezteko egutegia:

Eguna /
ordua
Ikaslea Zuzendaria(k) Izenburua
Irailak 21

15:00

Garcia Montero, Eneritz Arantza del Pozo-Echezarreta

Itziar Gonzalez-Dios

Coping with Data Scarcity: First Steps towards Word Expansion for a Chatbot in the Urban transportation Domain
Irailak 21

15:45

Lima Lopez, Salvador Montse Cuadros

Olatz Pérez de Viñaspre

Towards Orthographic and Grammatical Clinical Text Correction: a First Approach
Irailak 21

16:30

Toporkov, Olia Rodrigo Agerri Studying the Role of Morphological Information for Contextual Lemmatization in Highly Inflected Languages
Irailak 22

15:00

Susperregi Indakoetxea, Mari Olatz Pérez de Viñaspre

Ander Barrena

Muturretik muturrerako informazio erauzketa eleaniztuna eta hizkuntzen arteko terminoen lerrokatze neuronala
Irailak. 22

15:45

Ortuondo Reyero, Aitor German Rigau Domain Disambiguation using Contextual Word Embeddings
Irailak 22

16:30

Xu, Xiao Martijn Wieling

German Rigau

Multilingual Classification for Legal Prediction
Irailak 22

17:15

Martinez Alvarez, Cristina Aitor Soroa

Rodrigo Agerri

BarceloQA: Building a Dataset for the Tourism Domain

]]>
https://www.unibertsitatea.net/blogak/ixa/2020/09/16/hap-lap-masterreko-tesiak-2020-09-21-eta-22an/feed/ 1
Masterreko ikasleak irabazle EHealth-KD txapelketako erlazio-erauzketan https://www.unibertsitatea.net/blogak/ixa/2020/05/11/masterreko-ikasleak-irabazle-ehealth-kd-txapelketako-erlazio-erauzketan/ https://www.unibertsitatea.net/blogak/ixa/2020/05/11/masterreko-ikasleak-irabazle-ehealth-kd-txapelketako-erlazio-erauzketan/#respond Mon, 11 May 2020 07:45:43 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=2830 HAP-LAP masterreko ikasleak diren Oscar Sainz-ek eta Edgar Andrés-k eHealth-2020 txapelketan emaitza bikaina lortu dute Oier Lopez de Lacalle and Aitziber Atutxa irakasleekin aurkeztuta. Beraien taldea (IXA-NER-RE) txapelduna izan da erlazio-erauzketako azpiatazan, bigarrenari alde nabarmena aterata gainera.

Beren helburu nagusia erlazio-erauzketako azpiatazan parte hartzea bazen ere, beste bietan ere (entitate-ezagutzan eta domeinu-aldaketan) sistematxo bat aurkeztu zuten, eta laugarren geratu dira sailkapen orokorrean.

ZORIONAK Oscar Sainz, Edgar Andrés, Oier lopez de Lacalleri eta Aitziber Atutxari!
Lan bikaina egin dute!

Emaitzak hemen ikusgai:
https://knowledge-learning.github.io/ehealthkd-2020/results

IXA-NER-RE taldea erlazio-erauzketako 1. postuan

 

 

 

 

 

 

 

 

 

]]>
https://www.unibertsitatea.net/blogak/ixa/2020/05/11/masterreko-ikasleak-irabazle-ehealth-kd-txapelketako-erlazio-erauzketan/feed/ 0
Humanitate digitaletan aukerak (sarean.eus) https://www.unibertsitatea.net/blogak/ixa/2018/11/23/humanitate-digitaletan-aukerak-sarean-eus-alegria-eta-agirre-2018-11-22/ https://www.unibertsitatea.net/blogak/ixa/2018/11/23/humanitate-digitaletan-aukerak-sarean-eus-alegria-eta-agirre-2018-11-22/#respond Fri, 23 Nov 2018 09:37:20 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=2673

Humanitate Digitalak: Giza eta gizarte zientzietan ikertzeko metodo berriak artikulua idatzi dute eta sarean.eus webgunean. Hona hemen horko zati batzuk:

“Giza eta gizarte-zientzietan ohikoak diren esperimentu kualitatiboetatik emaitza kuantitatiboetara eramateko aukera ematen ditu hizkuntz teknologiek, eta bestalde, humanitateek erronka berriak eskaintzen diete teknologoei. Historia, kultura eta literatura, kazetaritza, soziolinguistika, arkeologia eta beste jakintza arlo askotan aldaketa sakonak sumatzen ari dira ikerketa metodoetan. Kritikak ere badaude.”

[…]

“Europan Clarin ikerketarako azpiegitura sarea hedatu da arlo berri honi begira eta Ixa taldeak hartzen du parte bertan. Tresna orokor gisa Analhitza eskaintzen dugu norberak bere testuak prestatu eta analizatuta jaso ditzan.”

[…]

 “Soziolinguistikan bi proiektu garatu dira gure inguruan, Twitterreko testuak iturritzat hartuta eta HAP/LAP masterreko ikasleen amaierako lanetan oinarrituta, bat gazteen mintzagaiak eta sareak identifikatzeko, eta bestea corpus interesgarri bat sortzeko kode alternantziari (code switching) begira. Bi lanetako oinarrian “Computational sociolinguistics: A survey.“  izeneko artikulu interesgarria dago, azpiarlo honetarako ezinbesteko erreferentzia dena. Gazteen mintzagaien inguruan, adibidez ondoko taula interesgarria eskaintzen da aipatutako lanean”

 

[…]

“Historian aukera handiak daude azken urteotan digitalizatutako testuak ustiatzeko. Adibide gisa  artikulu honetan (Whodunit. . . and to Whom? Subjects, Objects, and Actions in Research Articles on American Labor Unions) Vilja Huldenek analisi sintaktiko automatikoa erabiltzen du lan munduaren soziologia historikoan ikertzeko. Nork, nori, zer, non, noiz identifikatzea datuetan oinarritutako kazetaritzaren funtsean dago. Arkaitz Zubiagaren lana azpimarragarria da arlo horretan, Korrikaren inguruko argitalpen honetan egiaztatu daitekeen moduan. Hainbat oinarrizko teknologia erabiliz eta konbinatuz oso emaitza interesgarriak lortzen ditu, adibidez gaiaren inguruko sare hau:”

[…]

“Edonola ere susmoa dugu Humanitate Digitalek duten potentzia baliatzeko hasieran gaudela, eta Euskal Herrian aukera handiak ditugula lan interesgarriak aurrera eramateko. Horretarako beharrezkoa litzateke aipatutako arlo guztien artean lankidetza handitzea ingurune digitalean. Administrazioaren laguntza ere ez litzateke gaizki etorriko.”

Artikulu osoa sarean.eus webgunean irakur dezakezu (Humanitate Digitalak: Giza eta gizarte zientzietan ikertzeko metodo berriak).

]]>
https://www.unibertsitatea.net/blogak/ixa/2018/11/23/humanitate-digitaletan-aukerak-sarean-eus-alegria-eta-agirre-2018-11-22/feed/ 0
HAP/LAP masterreko tesiak (2018-09-25) https://www.unibertsitatea.net/blogak/ixa/2018/09/22/haplap-masterreko-tesiak-2018-09-25/ https://www.unibertsitatea.net/blogak/ixa/2018/09/22/haplap-masterreko-tesiak-2018-09-25/#respond Sat, 22 Sep 2018 08:13:42 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=2516 Hizkuntzaren Azterketa eta Prozesamendua HAP-LAP masterrean sei master-tesi aurkeztuko dira asteartean, irailak 25. Ekainean beste lau master-tesi aurkeztu ziren.

15:00
Multilingual Word Embeddings and Their Utility In Cross‐lingual Learning
Ikaslea/Student: Kulmizev, Artur
Zuzendariak/Supervisors: Eneko Agirre, Gertjan Van Noord

15:45
Neural Natural Language Generation with Unstructured Contextual Information
Ikaslea/Student: Gete Ugarte, Harritxu
Zuzendariak/Supervisors:Thierry Etchegoyhen, Oier Lopez de Lacalle

16:30
Automating the Anonymisation of Textual Corpora
Ikaslea/Student:Garcia Sardiña, Laura
Zuzendariak/Supervisors:Arantza del Pozo, Izaskun Aldezabal

17:15
Itzulpen automatikoaren kalitate estimaziorako bi tresnen konparaketa: Quest++ eta sare neuronal bidezko hurbilketa
Ikaslea/Student:Garcia Sardiña, Laura
Zuzendariak/Supervisors: Gorka Labaka, Ilaki Alegria

18:00
Analysis, overview and Creation of an Arabic LVCSR
Ikaslea/Student: Puerto Gonzalez, Aratz
Zuzendariak/Supervisors: Eva Navas, Aitor Álvarez

18:45
Efficient Extraction of Parallel Corpora from Wikipedia
Ikaslea/Student: Rubio Astigarraga, Jon
Zuzendariak/Supervisors: Thierry Etchegoyhen, Gorka Labaka

]]>
https://www.unibertsitatea.net/blogak/ixa/2018/09/22/haplap-masterreko-tesiak-2018-09-25/feed/ 0
HAP/LAP masterreko tesiak (2018-06-26) https://www.unibertsitatea.net/blogak/ixa/2018/07/17/haplap-masterreko-tesien-defentsa-2018-07-17/ https://www.unibertsitatea.net/blogak/ixa/2018/07/17/haplap-masterreko-tesien-defentsa-2018-07-17/#comments Tue, 17 Jul 2018 08:48:19 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=2470 Ekainean lau master tesi aurkeztu dira Hizkuntzaren Azterketa eta Prozesamendua masterrean

15:00
Noisy Speech Recognition using Kaldi and Neural Architectures
(Hizketa zaratatsuaren ezagutza Kaldi eta Neurona- arkitekturak erabilita)
Ikaslea/Student: Ander González Docasal
Zuzendariak/Supervisors: Vassilis Tsiaras, George P. Kafentzis, Yannis Stylianou

15:45
Unsupervised Methods to Predict Example Difficulty in Word Sense Annotation
(Hitzen adiera etiketatzeko zailtasunak aurrikusteko metodo ez-gainbegiratuak)
Ikaslea/Student: Cristina Aceta Moreno
Zuzendariak/Supervisors: Oier Lopez de Lacalle, Eneko Agirre, Izaskun Aldezabal

16:30
To post‐edit or to translate… That is the question.
A case study of a recommender system for Quality Estimation of Machine Translation based on linguistic feature
(Posteditatu edo itzuli?… Horra hor auzia.
Ezaugarri linguistikoetan oinarrituta Itzulpen Automatikoaren kalitatea aurreikusten duen sistema aholkulari baten kasu-azterketa)
Ikaslea/Student: Ona de Gilbert Bonet
Zuzendaria/Supervisor: Nora Aranberri

17:15
Basque‐to‐Spanish and Spanish‐to‐Basque Machine Translation for the health domain
(Osasungintzarako itzulpen sistema, euskara-espainiera eta gaztelania-euskara)
Ikaslea/Student: Xabier Soto García
Zuzendariak/Supervisors: Gorka Labaka, Olatz Perez de Viñaspre
Zuzendarikidea/Co‐advisor: Maite Oronoz

]]>
https://www.unibertsitatea.net/blogak/ixa/2018/07/17/haplap-masterreko-tesien-defentsa-2018-07-17/feed/ 1
Lan-poltsak eta udako praktikak IXA ikerkuntza taldean https://www.unibertsitatea.net/blogak/ixa/2018/03/13/lan-poltsak-eta-udako-praktikak-ixa-ikerkuntza-taldean/ https://www.unibertsitatea.net/blogak/ixa/2018/03/13/lan-poltsak-eta-udako-praktikak-ixa-ikerkuntza-taldean/#respond Tue, 13 Mar 2018 19:00:08 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=2399
An Overview Of Artificial Intelligence
In The Event Industry

Informatikako graduko edo master bateko ikaslea zara?
Kuxkuxero gai hauetan?

  • big data, deep learning
  • hizkuntzaren prozesamendua
  • aplikazioen garapena (zerbitzariak, clusterrak, GPUak,… )

Gurekin aritu nahi? Orduan…
eskatu lan-poltsa bat IXA ikerketa taldean
… martxoaren 22a baino lehen,
… bidali zure CVa (ixa.administratzailea@ehu.eus)

Gradurako zein masterreko lan-poltsak eskaintzen ditugu, baita udako lanak ere.

 

]]>
https://www.unibertsitatea.net/blogak/ixa/2018/03/13/lan-poltsak-eta-udako-praktikak-ixa-ikerkuntza-taldean/feed/ 0
Itzulpengintza automatiko neuronala. Jardunaldi irekia Kyunghyun Cho adituarekin (2017-05-29) https://www.unibertsitatea.net/blogak/ixa/2017/05/16/2218/ https://www.unibertsitatea.net/blogak/ixa/2017/05/16/2218/#comments Tue, 16 May 2017 20:10:18 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=2218 Itzulpengintza automatikoaren hirugarren belaunaldia garatzen ari da. Garai batean erregela linguistikoetan oinarritutako sistemak ziren nagusi (RBMT teknologia), azken hamarkadan, berriz, estatistikan oinarritutako sistemak gailentzen joan dira (SMT teknologia), eta azken bi urtetan neurona-sareetan oinarritutako sistemek hobekuntza kualitatiboak lortzen ari dira (NMT teknologia), teknologia hau ikergai nagusia bihurtuz itzulpengintza automatikoaren arloan. Jardunaldi honetan teknologia horren azken aurrerapenak aurkeztu nahi ditugu, euskararen gainean lortu ditugun emaitzak barne.

Modela_irudia11Testuingurua:

NMT teknologian ikertzea eta, are gehiago, erronka handia den euskararen itzulpen automatiko onargarrira iristea da Modela proiektuaren helburua. Modela proiektua Eusko Jaurlaritzak finantzatzen du eta honako erakundeak dira partaideak: Ametzagaiña, Elhuyar, ISEA, UPV/EHUko Ixa taldea eta Vicomtech/IK4.

Gonbidatua:

Jardunaldi honen gonbidatu nagusia Kyunghyun Cho (Center for Data Science, New York University), ikerlari ezaguna da. NMT arloan aditu erreferentziatuenetako bat da, Google saria jaso du gai horretan eta hizlari bikaina ere bada.

Noiz: 2017ko maiatzaren 29, goizeko 11.00etan
Non: EHUko Informatika Fakultatea, ManuelLardizabal 1, 20018 Donostia (mapa)
Hizkuntza: ingelesa
Programa:

11.00-11.15: Sarrera eta proiektuaren aurkezpena
11.15-12.30: NMT (Kyunghyun Cho)
12.30-13.15: Modela proiektuaren lehen emaitzak

Babesleak: Modela proiektua, TAdeep proektua eta UPV/EHUko Gipuzkoako errektoreordetza

Biharamonean 15:00ean, maiatzak 30, HAP masterreko ikasleekin arituko da Kyunghyun Cho irakaslea.

Bideoak eta gardenkiak:

Sponsors: Modela projectTAdeep project and University of the Basque Country

Modela_irudia3

]]>
https://www.unibertsitatea.net/blogak/ixa/2017/05/16/2218/feed/ 2
HAP/LAP masterreko lau tesiren defentsa https://www.unibertsitatea.net/blogak/ixa/2016/09/26/haplap-masterreko-tesien-defentsa/ https://www.unibertsitatea.net/blogak/ixa/2016/09/26/haplap-masterreko-tesien-defentsa/#respond Mon, 26 Sep 2016 17:47:07 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=2063 Eguna: irailaren 27a     Lekua: Ada Lovelace aretoa

15:30
Universal Dependencies for Buryat.
Egilea: Elena Badmaeva
Tutoreak: Koldo Gojenola , Gosse Bouma

16:15
LexSynSimpleText, a lexical and syntactic simplifier: first steps.
Egilea: Maria Eguimendia
Tutoreak: Arantza Diaz de Ilarraza and Gosse Bouma

17:00
Data Sparsity in Highly Inflected Languages: The Case of Morphosyntactic Tagging in Polish.
Egilea: Michael Ustaszewski
Tutoreak: Rodrigo Agerri and German Rigau

17:45
Multilingual Central Repository version 3.0: improving a very large lexical knowledge base.
Egilea: Daniel Parera Perez
Tutoreak: German Rigau Claramunt

]]>
https://www.unibertsitatea.net/blogak/ixa/2016/09/26/haplap-masterreko-tesien-defentsa/feed/ 0
Nora Aranberri Innsbruckeko udako ikastaroan irakasle https://www.unibertsitatea.net/blogak/ixa/2016/07/24/nora-aranberri-innsbruckeko-udako-ikastaroan-irakasle/ https://www.unibertsitatea.net/blogak/ixa/2016/07/24/nora-aranberri-innsbruckeko-udako-ikastaroan-irakasle/#respond Sun, 24 Jul 2016 17:28:43 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=2053 Innsbruck2Nora Aranberri taldekidea, Innsbruck-eko Unibertsitateak inbitatuta, irakaslea izan da Machine Translation for Translators: Taking Advantage of the New Technology workshopean, SummerTrans 2016 udako ikastaroaren barruan.

Itzultzaileentzako SummerTrans udako ikastaroa 2004an hasi zen. Aurten uztailaren 11tik 20ra izan da, itzulpenaren kalitatea eta egokitasuna gaia landu dutela: “SummerTrans VII: Quality and Competence in Translation”.
Partehartzaileak 60 izan dira, 16 herrialdetakoak: Tunisia, Europa, Txina eta India.NoraInnsbruck2016Michael Ustaszewski, 2014-2016 biurteko gure Eramus Mundus LCT masterreko ikaslea, orain irakaslea da Innsbruck-eko Unibertsitatean eta SummerTrans 2016 ikastaroko antolatzaileetako bat ere izan da

IMG_1428b
Michael-ek esan digu workshopeko ikasleak oso pozik geratu direla Norarekin ikasi dutenarekin 😉

 

]]>
https://www.unibertsitatea.net/blogak/ixa/2016/07/24/nora-aranberri-innsbruckeko-udako-ikastaroan-irakasle/feed/ 0
Google-ren ikerketa-saria Eneko Agirreri hitzen esanahiak grafikoki erakusteagatik https://www.unibertsitatea.net/blogak/ixa/2016/03/21/google-ren-ikerketa-saria-hitzen-esanahiak-grafikoki-erakusteagatik/ https://www.unibertsitatea.net/blogak/ixa/2016/03/21/google-ren-ikerketa-saria-hitzen-esanahiak-grafikoki-erakusteagatik/#comments Mon, 21 Mar 2016 18:44:57 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=1965 Gráfico Eneko AgirreEneko Agirre: “…gure proposamena gai da hainbat hizkuntzatako hitzen esanahiak espazio bakar batean irudikatzeko; horri esker, jakin ahal izango dugu banku hitzaren adiera bat ingeleseko bank hitzaren eta euskarazko kutxa hitzaren antzekoa dela, eta beste adiera chair eta aulki hitzen antzekoa, baina bi adiera horietako bat ere ez dela katu edo cat hitzen antzekoa.”

Horrelako metodoak dira Eneko Agirrek UPV/EHUko Donostiako Informatika Fakultateko ‘Language Analysis and Processing’ masterrean ematen duen ikastaroaren oinarria.

Eneko_Google_saria_DV
Ixa ikertaldeko Eneko Agirre saritu du Google Researchek (DV, 2015-03-18)
Eneko_GR_saria_Deia
Eneko Agirre EHUko irakasleak Google Research Awards sarietako bat jaso du (Deia, 2015-03-18)
Eneko_Google_saria_europa_press
Eneko Agirre EHUko irakaslea, Google Research Awards saridun (Europa Press, 2015-03-18)
Eneko_Google saria Not_Gip
Google premia a Eneko Agirre, profesor de la UPV (Noticias de Gipuzkoa, 2015-03-19)
Eneko_Google_bizkaie
Google Researchek Eneko Agirre irakaslea saritu dau (Bizkaie, 2015-03-18)
Eneko_Google_saria_Ehu
Google Researchek Eneko Agirre irakaslea saritu du (UPV-EHU, 2015-03-18)
]]>
https://www.unibertsitatea.net/blogak/ixa/2016/03/21/google-ren-ikerketa-saria-hitzen-esanahiak-grafikoki-erakusteagatik/feed/ 2