Proiektua – Hizkuntza-teknologiak, Ixa Taldearen bloga https://www.unibertsitatea.net/blogak/ixa IXA taldea. Hizkuntzaren prozesamendua Wed, 31 May 2023 21:32:01 +0000 eu hourly 1 https://wordpress.org/?v=4.9.23 https://www.unibertsitatea.net/blogak/ixa/files/2018/10/ixa.jpg Proiektua – Hizkuntza-teknologiak, Ixa Taldearen bloga https://www.unibertsitatea.net/blogak/ixa 32 32 Kubako sari akademiko gorena Xabier Artola Ixakideari (2023-02-16) https://www.unibertsitatea.net/blogak/ixa/2023/02/16/kubako-sari-akademiko-gorena-xabier-artola-ixakideari-2023-02-16/ https://www.unibertsitatea.net/blogak/ixa/2023/02/16/kubako-sari-akademiko-gorena-xabier-artola-ixakideari-2023-02-16/#respond Thu, 16 Feb 2023 20:13:15 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=3135 Kubak “Carlos J. Finlay” Ordenaren Saria eman dio Ixa Taldeko Xabier Artola irakasleari 2023ko otsailaren 16an. Kubako zientzialari nazionalei eta atzerritarrei ematen dien kondekoraziorik gorena da hori. Artolari Kubarekin 20 urteko lankidetza zientifiko emankorrarengatik eman diote saria. Santiagoko Linguistika Aplikatuaren Zentroarekin bereziki.

Xabier Artolari Carlos J. Finlay saria  emateko ekitaldia(Kuba, 2023-02-16)

Euskal Herriko Unibertsitateko IXA taldea lankidetzan aritu izan da 2001tik CLA ikergunearekin. Hortik atera da, adibidez, Diccionario Básico Escolar Cubano (DBE) hiztegia (digitala eta paperezkoa). Lankidetza honen barruan mende hasieran sortu zen lehenengo bertsioan hiztegiaren diseinu informatikoa oso aurreratu izan zen: XML lengoaia kodetuta dago), eta hiztegiak editatzeko Ixa taldean garatu zen leXkit izeneko ingurunea erabiltzen zen. Geroago hiztegiaren lau edizio (2005, 2008, 2009, 2013-2015) argitaratu dira Kuban, paperean eta digitalki. Hiztegiaren sortzaileak Eloína Miyares Bermúdez eta Vitelio Ruiz Hernández linguistak ziren. Urteetan zehar zabalkuntza handia izan du hiztegiak Kubako eskoletan. 2023. urtera arte guztira hiztegiaren 300.000tik gora ale salduta zeuden paperean, eta bertsio elektronikoan 1100 CD.

Irakurri gehiago:

]]>
https://www.unibertsitatea.net/blogak/ixa/2023/02/16/kubako-sari-akademiko-gorena-xabier-artola-ixakideari-2023-02-16/feed/ 0
LINGUATEC produktuak erabiltzeko hitzarmena lau unibertsitaterekin https://www.unibertsitatea.net/blogak/ixa/2022/01/31/linguatec-produktuak-erabiltzeko-hitzarmena-lau-unibertsitaterekin/ https://www.unibertsitatea.net/blogak/ixa/2022/01/31/linguatec-produktuak-erabiltzeko-hitzarmena-lau-unibertsitaterekin/#respond Mon, 31 Jan 2022 09:47:27 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=3058
Euskal Herriko Unibertsitateko errektorea, Eva Ferreira eta Elhuyarreko koordinatzaile nagusia, Jon Abril, beste hiru errektoreekin: Université de Pau et des Pays de I´Adour unibertsitatekoarekin. Zaragozako Unibertsitatekoa , eta  Nafarroako Unibertsitate Publikokoa.

LINGUATEC proiektua ekainean bukatu zen. Emaitza oparoak lortu ditugu, 20 produktu aurkeztu genituen Bruselako META-FORUMean (2021-11-15). Geroago Udaberrian hainbat ekitaldi antolatuko genituen enpresei proiektuaren emaitzak aurkezteko.

  • 2021/02/23 Pau, Emaitzak aurkeztea
  • 2021/04/13 Jaca, Emaitzak aurkeztea eta erakusketa-tailerrak
    Jacan Aragoiko enpresek sinatu zuten hitzarmen bat
  • 2021/06/17 Donostia/Baiona: Emaitzak aurkeztea eta erakusketa-tailerrak
    Pauen Okzitaniako enpresek sinatu zuten  hitzarmen bat
  • 2021/06/18 Donostia: LINGUATEC kongresua. Erakusketa-tailerrak
    Donostian euskal enpresek sinatu zuten hitzarmen bat eta Linguatec AI Bikaintasun-Sarea sortu genuen (2021-06-18)

Proiektuko emaitzak zabaltzen urrats berri bat egin dugu. Jacan 2022ko urtarrilaren 20an Linguatec Proiektuak lankidetza-hitzarmen bat sinatu du lau unibertsitaterekin: Euskal Herriko Unibertsitatea, Zaragozako Unibertsitatea, Paueko eta Aturrialdeko Unibertsitatea, eta  Nafarroako Unibertsitate Publikoa. POCTEFA proiektuen arduraduna ere egon da sinatze-ekitaldian.

  • Hitzarmen horri esker, euskararentzat, aragoierarentzat eta okzitanierarentzat EFA 227/16/LINGUATEC proiektuan garatutako tresna eta aplikazio teknologikoak erabili eta inplementatu ahal izango dituzte unibertsitateek.
  • Lankidetza-hitzarmenak lau urteko iraupena izango du, eta sinatu duten erakundeek elkarlanean aritzeko konpromisoa hartu dute, adimen artifizialaren esparruan euskara, okzitaniera eta aragoierarentzako proiektu teknologikoak garatzeko.

Hitzarmen hau beste urrats estrategiko bat da mugaz gaindiko azpiegitura linguistiko inklusibo, eleaniztun eta adimendun baten eraikuntza zientifiko-teknologikorako.

Albisteak:

Irakurri albistea sei hizkuntzatan: eu, es, ca, gl, fr, en 

]]>
https://www.unibertsitatea.net/blogak/ixa/2022/01/31/linguatec-produktuak-erabiltzeko-hitzarmena-lau-unibertsitaterekin/feed/ 0
LINGUATEC proiektuko emaitzak META-FORUM 2021en (2021-11-15) https://www.unibertsitatea.net/blogak/ixa/2021/11/15/linguatec-proiektuko-emaitzak-meta-forum-2021en-2021-11-15/ https://www.unibertsitatea.net/blogak/ixa/2021/11/15/linguatec-proiektuko-emaitzak-meta-forum-2021en-2021-11-15/#comments Mon, 15 Nov 2021 12:57:45 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=3039

LINGUATEC proiektu europarrean lortutako emaitzak aurkeztu ditugu gaur poster batean META-FORUM 2021 biltzarrean. Proiektuaren xedea okzitanieraren, aragoieraren eta euskararen digitalizazio-maila hobetzea zen, eta bete-betean lortu dugu. Hauek izan dira emaitzak:

EUSKARA

INTELE kongresuko posterra (CC-BY-SA)

ARAGOIERA

LINGUATEC eskuinaldean erdian, poster-saio “telematikoan”

OKZITANIERA

BALIABIDE ELEANIZTUNAK

]]>
https://www.unibertsitatea.net/blogak/ixa/2021/11/15/linguatec-proiektuko-emaitzak-meta-forum-2021en-2021-11-15/feed/ 2
Linguatec AI Bikaintasun-Sarea (2021-06-18) https://www.unibertsitatea.net/blogak/ixa/2021/10/08/linguatec-ai-bikaintasun-sarea-2021-06-18/ https://www.unibertsitatea.net/blogak/ixa/2021/10/08/linguatec-ai-bikaintasun-sarea-2021-06-18/#comments Fri, 08 Oct 2021 12:09:32 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=3028

Bukatu da aurten LINGUATEC proiektu europarra. Proeiktuaren xedea okzitanieraren, aragoieraren eta euskararen digitalizazio-maila hobetzea izan da, eta neurri handi batean lortu dugu helburua.

  • 2021eko maiatzeko workshopean emaitza zientifikoak konpartitu genituen komunitate akademikoarekin,
  • Ekaineko biltzar publikoan Linguatec AI Bikaintasun-Sarea sortu genuen proiektuko kideen artean, 2018-2021 urteetan egin dugun lankidetza-lan eredugarriari jarraipena emateko.
Linguatec sarearen erakunde sortzaileen ordezkariak: Elhuyar fundazioa, Aragoiko Gobernua, Okzitaniako Tolosako CRNS goi mailako ikerketa zentroa, Euskaltzaindia, Lo Congrés okzitanieraren akademia eta EHUko Ixa taldea. (Naiz, 2021-06-19)

Sare berria sortzeko adierazpena lau hizkuntzatan idatzi genuen (espainieraz, frantsesez, okzitanieraz eta euskaraz, LINGUATEC-AI_ES-EU-FR-OC.pdf). Hau da euskarazko bertsioa:

 

LINGUATEC AI BIKAINTASUN-SAREA

Adimen Artifiziala Hizkuntzan Mugaz Gaindiko Bikaintasun Sarea eratzea (Pirinioez gaindiko hizkuntza-azpiegitura eraikitzeko lankidetza teknologikoa)

Pirinioetako Lan Elkartearen lurraldea eraikitzen ari diren mugaz gaindiko proiektua da, eta 15 milioi herritarrek baino gehiagok partekatzen dituzte 6 hizkuntza eta horien tokiko barietateak. Eleaniztasuna gure lurraldeko aktiborik handienetako bat da, eta erronka garrantzitsuenetako bat ere bada, kulturaren eta ekonomiaren ikuspegitik kohesionatutako lurralde bat sortzeko. Gauza bera gertatzen da Europan, non hogeita lau hizkuntza ofizial eta 60 hizkuntza gutxitu baino gehiago osatzen duten eremu eleaniztun aberatsa baita; garai batean, eleaniztasuna komunikazioa eta informazioaren zirkulazio librea zailtzen zituzten hizkuntza-oztopo gisa ikusi ziren.

Adimen artifiziala hizkuntza eguneroko produktu digital askotan erabiltzen da, gehienak hizkuntzaz baliatzen baitira. Komunikazio mugikorrek, sare sozialek, laguntzaile adimendunek eta ahotsean oinarritutako interfazeek herritarrak, enpresak eta administrazio publikoak mundu digitalean elkarreraginean aritzeko modua aldatzen ari dira

Hizkuntza-teknologiek eraginkortasunez laguntzen dute Europako herritar guztien (eta Pirinioetako Lan Elkartearen lurraldearen) arteko berdintasuna lortzen eguneroko bizitzan, edozein dela ere hitz egiten duten hizkuntza. Nahiz eta hizkuntza gutxituek asko duten irabazteko hizkuntza-teknologiekin, egoera teknologiko ahula dute abiapuntu; izan ere, hizkuntza horiek digitalki garatzeko behar diren tresna eta baliabideak oso urriak dira, eta, kasu batzuetan, ez dira existitzen. 2018ko irailaren 11n Europako Parlamentuak onartutako ebazpenean (“On language equality in the digital age” 2018/2028(INI)) argiki egiaztatu du Europako hizkuntzen artean desoreka dagoela hizkuntzaren teknologien barruan, eta ekintzarako deia egin du, hizkuntzen arteko arrakala horiek lehenbailehen gainditzeko.

Hizkuntza baten garapena, eta beraz, hizkuntza horretatik elikatzen den kultura, erabat loturik dago hizkuntza horrek ingurune moderno eta aldakorretan, hala nola mundu digitalean funtzionatzeko duen gaitasunarekin. Hala, hizkuntza- eta kultura-aniztasuna estu lotuta dago mundu digitalean hizkuntza batek dituen gaitasun eta baliabideekin, hau da, gure kasuan mugaz gaindiko hizkuntza-azpiegitura sortzearekin. Hori dela eta, oso garrantzitsua da hizkuntza-oztopoak gainditzea eta, hartara, Pirinioetako Lan Elkartearen lurraldeko hizkuntzak indartzea, lurraldeak duen balio ekonomiko, kultural eta linguistikoa osorik bultzatu ahal izateko.

Lurraldeko hizkuntza guztientzat euskarri teknologiko egokia bermatzeak enplegua sortuko dugu, hazkuntza, aukerak, kulturarteko harremanak eta nazioarteko erreferentzialtasuna.

Era berean, funtsezkoa da ingurune digitaleko hizkuntza-oztopoak gainditzea, funtsezkoa baita gizarte inklusiborako eta aniztasunari batasuna eta kohesioa emateko urte askoan.

Linguatec AI Bikaintasun Sarearen xedea

Adimen Artifiziala Hizkuntza Mugaz Gaindiko Bikaintasun Sarea sortzea, lankidetza teknologikoaren bidez Pirinioez gaindiko hizkuntza-azpiegitura eraikitzen laguntzeko.

Helburuak

1. LINGUATEC bezalako mugaz gaindiko proiektuen beharra balioan jarri eta transmititzea, gure lurraldearen aberastasun eleaniztunak balio ekonomiko, turistiko eta kulturala sortzen baitu. Hau da, hizkuntza-hesia gainditzea eta ahaleginak batzea gure kultura- eta hizkuntza-aberastasuna motor ekonomiko gisa aprobetxatzeko.

2. Agenda estrategiko baten oinarriak eta ibilbide-orri bat ezartzea, hizkuntza-berdintasun digitala errealitate izan dadin Pirinioetako Lan Elkartearen lurraldean 2030ean.

3. Euskararen, katalanaren, aragoieraren eta okzitanieraren arteko lankidetza estua abiaraztea, guztiek oinarri teknologiko nahikoa izan dezaten, eta, hartara, pertsona bakoitzak bere hizkuntzan eroso parte har dezan mundu digitalean.

4. Adimen artifizialak hizkuntza eskaintzen dizkigun aukerak eta ahalmenak gizarteratzea, lurralde kohesionatua, integratzailea, eleaniztuna eta adimenduna lortzeko.

5. Adimen artifizialean azken belaunaldiko ezagutza eta teknologia sortzea, enpresek, erakundeek eta gizarte-erakundeek teknologiaren ahalmena aprobetxa dezaten Pirinioetako Lan Elkartearen lurraldearen garapen ekonomiko, sozial eta instituzionalerako.

6. Beste lurralde eleaniztun batzuetan, Europan zein mundu osoan, Pirinioetako Lan Elkartearen lurraldean lortutako lorpenak zabaltzea, esperientzia, prestakuntza, aholkularitza eta teknologia eskainiz.

7. Pirinioetako Lan Elkartearen lurraldea erreferentzia garrantzitsu bihurtzea hizkuntza-teknologietan baliabide urriak dituzten hizkuntzentzat eta haren garapen digitalean aurrera egin nahi duten hizkuntzentzat.

]]>
https://www.unibertsitatea.net/blogak/ixa/2021/10/08/linguatec-ai-bikaintasun-sarea-2021-06-18/feed/ 1
Workshop: Pirinioetako hizkuntzak automatikoki prozesatzeko baliabideak eta tresnak (online, 2021-05-12) https://www.unibertsitatea.net/blogak/ixa/2021/04/30/workshop-pirinioetako-hizkuntzak-automatikoki-prozesatzeko-baliabideak-eta-tresnak-online-2021-05-12/ https://www.unibertsitatea.net/blogak/ixa/2021/04/30/workshop-pirinioetako-hizkuntzak-automatikoki-prozesatzeko-baliabideak-eta-tresnak-online-2021-05-12/#comments Fri, 30 Apr 2021 12:20:46 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=2975

INTELE bilkuran erakutsitako posterra (2020, CC-BY-SA)

Okzitanieraren, aragoieraren eta euskararen  digitalizazio-maila hobetzea izan da LINGUATEC proiektu europarraren helburua. Hainbat baliabide, tresna eta aplikazio linguistiko berritzaile garatu ditugu 2018tik hona. Proiektuak hizkuntzen arteko lankidetza teknologikoa ahalbidetu du.

Orain online workshop hau antolatu dugu. 2021eko maiatzaren 12an konpartituko dugu komunitate akademikoarekin.
Online izango da, aurkezpenak ingelesez, gaztelaniaz eta frantsesez, eta aldi bereko itzulpenak ingelesez, gaztelaniaz eta frantsesez.

Interesa duten ikertzaile guztientzat, proiektuaren barruan egindako lana zabaltzeko, baita euskararako eta okzitanierarako egindako aurrerapen batzuk aurkezteko ere.

Workshopa jende guztiarentzat dago irekita, baina erregistratu egin behar da (registration form)

Informazio gehiago: ixa.eus/events/linguatec

 

PROGRAMA

10h – Irekiera

10h15     Hitzaldi gonbidatuak: Katalanaren prozesamendua

    Lluis Padró (Universitat Politècnica de Catalunya)
    Morphological and Syntactic Resources in FreeLing
    Ingelesez – Aldibereko itzulpena espainieraz eta frantsesez

   Mariona Taulé (Universitat de Barcelona)
   AnCora: un corpus anotado a diferentes niveles lingüístico
AnCora hainbat hizkuntza-mailatan etiketatutako corpusa.
    Gaztelaniaz – Aldibereko itzulpena ingelesez eta frantsesez

11h15 — Atsenaldia

11h30 Aurkezpenak: Okzitanierarako eta euskararako corpus anotatuak

   Assaf Urieli, Joliciel
    Talismane, Jochre: automatic syntax analysis and OCR for under-resourced languages
    Ingelesez – Aldibereko itzulpena espainieraz eta frantsesez

   Aleksandra Miletic y Dejan Stosic, CLLE
    Mutualisation des ressources pour la création de treebanks : le cas du serbe et de l’occitan
    Frantsesez – Aldibereko itzulpena espainieraz eta frantsesez

    Ainara Estarrona (IXA, HiTZ, UPV/EHU)
    Construcción del corpus histórico en euskera
    Euskararen corpus historikoa eraikitzea
   Gaztelaniaz – Aldibereko itzulpena ingelesez eta frantsesez

13h — Bazkaltzeko etenaldia

14h30     Hitzaldi gonbidatua: Neurona-sareen erabilera

   Mans Hulden (University of Colorado)
   Neural Networks in Linguistic Research
    Ingelesez – Aldibereko itzulpena espainieraz eta frantsesez

15h30 Aurkezpena: Hizuntzaren prozesamendua

   Rodrigo Agerri (IXA, HITZ, UPV/EHU)
   Contextual lemmatization for inflected languages: statistical and deep-learning approaches
    Ingelesez – Aldibereko itzulpena espainieraz eta frantsesez

16h – Atsedenaldia

16h15 – Aurkezpenak: LINGUATEC proiektuaren emaitzak

    Myriam Bras, Aleksandra Miletic, Marianne Vergez-Couret, Clamença Poujade, Jean Sibille, Louise Esher, CLLE :
    Automatic processing of Occitan: construction of the first annotated corpora.
    Okzitaneraren prozesamendua: lehen corpus etiketatuaren eraikitzea.
    Okzitanierazko bideoa, azpitituluak beste hizkuntzetan.               

    Elhuyar
    Creation and improvement of Basque resources within the framework of Linguatec
    Euskarazko bideoa, azpitituluak beste hizkuntzetan. 

16h45 – Ondorioak
    Espainieraz eta frantsesez, itzulpen zerbitzurik gabe.   

]]>
https://www.unibertsitatea.net/blogak/ixa/2021/04/30/workshop-pirinioetako-hizkuntzak-automatikoki-prozesatzeko-baliabideak-eta-tresnak-online-2021-05-12/feed/ 3
Juan Cruz ‘Soccoo’ hil zaigu, Peruko lankide kitxua https://www.unibertsitatea.net/blogak/ixa/2021/04/11/juan-cruz-soccoo-hil-zaigu-peruko-lankide-kitxua/ https://www.unibertsitatea.net/blogak/ixa/2021/04/11/juan-cruz-soccoo-hil-zaigu-peruko-lankide-kitxua/#respond Sun, 11 Apr 2021 16:10:43 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=2965
Juan Cruz Soccoo (CC-BY-SA)

Cuscoko UNSAAC unibertsitateko lankidetzan aritu ginen 2011tik 2014ra bitarte. Lankidetza haren liderra izan zen Juan Cruz irakaslea apirilean hil zaigu.

Zuri esker, Juan, elkarrekin urrats batzuk egin genituen, kitxuaren prozesamendu automatikorako adituak prestatu genituen Hinantin ikerketa-taldearen hazia izan zirenak:

2012an Madrileko Kooperaziorako Ministerioko proiektu bat izan genuen, 2013an EHUrekin RUNASIMI proiektua.

Agur Juan, jarraituko dugu lanean.

Cuscoko taldea 2012ko urtarrilean (CC-BY-SA)

]]>
https://www.unibertsitatea.net/blogak/ixa/2021/04/11/juan-cruz-soccoo-hil-zaigu-peruko-lankide-kitxua/feed/ 0
Google-saria hirugarrenez irabazi du Eneko Agirre ixakideak https://www.unibertsitatea.net/blogak/ixa/2020/04/23/google-saria-hirugarrenez-irabazi-du-eneko-agirre-ixakideak/ https://www.unibertsitatea.net/blogak/ixa/2020/04/23/google-saria-hirugarrenez-irabazi-du-eneko-agirre-ixakideak/#respond Thu, 23 Apr 2020 05:25:39 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=2790

Eneko Agirrek aurten (martxoan) berriro lortu du Google-ren sari bat. Google Faculty Research Award saria hirutan lortu duen ikertzaile bakanetakoa da bera. Sariko 62.000 dolarrek ‘Conversational Question Answering agents that learn after deployment’ izeneko proiektua finantzatuko dute, erabiltzaileekin elkarrizketa-sistemak garatzeko.
Chatbot-ak eta adimen artifiziala.

HiTZ ikerketa-zentro sortu berriko zuzendaria da Eneko, Ixakidea  eta Informatika Fakultateko irakaslea. Proiektu irabazkean badira beste 6 ixakide hauek: Aitor Soroa eta Gorka Azkune irakasleak, Arantxa Otegi ikertzailea, Jon Ander Campos doktoretza ikaslea, Aitor Agirre Hizkuntza Prozesamenduan Masterreko masterreko ikaslea eta Eduardo Vallejo Informatikako graduko ikaslea.

Proiektua batez ere  ingelesezko elkarrizketetan zentratzen bada ere (sukaldaritzari eta elikadurari buruzko galderak), euskarazko elkarrizketekin ere lan egin dute. Horretarako iaz Ixa taldeak euskarazko elkarrizketak biltzeko boluntarioak erakartzeko kanpaina jarri zuen martxan. Kanpainak oso harrera ona izan zuen, eta pertsonei buruzko euskarazko elkarrizketak jaso ziren, Wikipedian dagoen informazioan oinarrituta (2.irudian adibide bat ikus daiteke). Norbaitek kanpainarekin bat egin nahi badu, nahikoa da http://ixa.eus/lagundu helbidera sartu eta izena ematea.

 

]]>
https://www.unibertsitatea.net/blogak/ixa/2020/04/23/google-saria-hirugarrenez-irabazi-du-eneko-agirre-ixakideak/feed/ 0
Google-sari bat Eneko Agirre ixakidearentzat https://www.unibertsitatea.net/blogak/ixa/2019/05/16/google-sari-bat-eneko-agirre-ixakidearentzat/ https://www.unibertsitatea.net/blogak/ixa/2019/05/16/google-sari-bat-eneko-agirre-ixakidearentzat/#respond Wed, 15 May 2019 22:52:36 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=2733

Orotara 80.000 dolarreko laguntza ekonomikoa jasoko du adimen artifizialean ikertzeko, konputagailuarekin elkarrizketan Interneten dagoen informazioa lortzeko sistemak sortuko dira proiektuan.

Horren elkarrizketa erreal asko eta asko jaso beharko dira, gero horiekin eredu automatikoak sortzeko.

Proiektua ingelesez egindako elkarrizketetan oinarrituta egon, beste hizkuntza batzuk ere landuko dira. Euskaraz ere bai.  Lagundu nahi duzu euskarazkoekin? Aski da http://ixa.eus/lagundu webgunean sartu eta izena ematea.
Bildutako elkarrizketak hizkuntzaren prozesamenduko masterreko ikasleentzako material ezin hobea izango da.

Irakurri artikulu osoa Campus aldizkarian: Eneko Agirre irakasleak Google erakundearen ikerketa sarietako bat lortu du

]]>
https://www.unibertsitatea.net/blogak/ixa/2019/05/16/google-sari-bat-eneko-agirre-ixakidearentzat/feed/ 0
Mintegia: Itzulpen automatikoko proiektuak, TADEEP eta MODELA (Gorka Labaka, 2018-03-27) https://www.unibertsitatea.net/blogak/ixa/2018/03/27/mintegia-itzulpen-automatikoko-proiektuak-tadeep-eta-modela-gorka-labaka-2018-03-27/ https://www.unibertsitatea.net/blogak/ixa/2018/03/27/mintegia-itzulpen-automatikoko-proiektuak-tadeep-eta-modela-gorka-labaka-2018-03-27/#respond Tue, 27 Mar 2018 07:56:49 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=2422
Noiz: asteartean, martxoak 27, 15:00etan
Non: 3.2 gelan.
Hizlaria: Gorka Labaka
Izenburua:  Itzulpen automatikoko proiektuak, TADEEP eta MODELA
Laburpena:

Mintegi honetan, azken urtean martxan izan ditugun itzulpen automatikoari buruz izandako proiektuetan (Tadeep eta Modela) egindako lanen berri emango da. Bi proiektuak itzulpena automatiko neuronalaren ingurukoak dira, eta, batez ere, euskara-gaztelera hizkuntza bikotea landu da. Bertan, oinarrizko NMT sistema bat entrenatzeaz gain, horren gaineko zenbait moldaketak landu ditugu. Lan horietatik, euskarazko testuen segmentazio aukera desberdinak, eta karaktereetan oinarritutako sistema azalduko dira aurkezpen honetan.  Ikusi demoa

]]>
https://www.unibertsitatea.net/blogak/ixa/2018/03/27/mintegia-itzulpen-automatikoko-proiektuak-tadeep-eta-modela-gorka-labaka-2018-03-27/feed/ 0
Lexikoaren Behatokia: Erabiltzen da hitz hau gaur egungo hedabideetan? https://www.unibertsitatea.net/blogak/ixa/2017/12/15/lexikoaren-behatokia-hitz-hau-erabiltzen-da-xxi-mendeko-hedabideetan/ https://www.unibertsitatea.net/blogak/ixa/2017/12/15/lexikoaren-behatokia-hitz-hau-erabiltzen-da-xxi-mendeko-hedabideetan/#comments Fri, 15 Dec 2017 14:59:13 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=2352

Senez aldizkariak artikulu hau argitaratu berri du:
Lexikoaren Behatokia: leiho bat XXI. mendeko hedabideetako euskarari

Euskaltzaindiaren ekimenez sortu zen Lexikoaren Behatokia corpusa 2007an, Hiztegi Batuko Lantaldeak hitzen benetako erabilerari buruzko informazioa eskuratzeko. Ez ea hitz bat testu klasikoetan historikoki erabili den, baizik eta ea XXI. mendeko hedabideotan egunerokoan erabiltzen den.

Elhuyar, UZEI eta Ixa Taldearekin lankidetzan, hamar urtetan ia 60 milioi hitzeko testu-corpus bat eratu da

Corpus horri esker Euskaltzaindiak detektatzen ditu medioetan asko erabili baina hiztegian ez dauden hitzak; esaterako, ea erreferentziatu aditza maiz erabiltzen den ala ez.

Aplikazio horri esker Euskaltzaindiak jakin dezake ea  emandako arauak benetan betetzen diren egunerokoan. Arau bat erabiltzen ez bada, agian moldatu edo hobeto azaldu beharko du.

Zorionez, Euskaltzaindiak bakarrik ez, denok kontsultatu dezakegu LB corpusa web bidez. Eta testuak linguistikoki prozesatuta daudenez, oso kontsulta erabilgarriak egin ditzakegu, esaterako:

Nolakoa izaten da ‘haizea’? Zein adjektiborekin lagunduta erabili ohi da?
Handia
, txikia esatea arruntegia izan daiteke… hitz interesgarriagorik?

Lexikoaren Behatokiak berehala esango dizu: bortitz, suabe, ahul...
Praktikoa da, ez da?

 

Corpus handi, orekatu, lematizatu, etiketatu eta linguistikoki anotatu honen zehaztasunak ezagutu nahi badituzu… irakurri artikulua.

 

Egileak hauek dira:

 

 

 

]]>
https://www.unibertsitatea.net/blogak/ixa/2017/12/15/lexikoaren-behatokia-hitz-hau-erabiltzen-da-xxi-mendeko-hedabideetan/feed/ 2