hizkuntza-baliabideak – Hizkuntza-teknologiak, Ixa Taldearen bloga https://www.unibertsitatea.net/blogak/ixa IXA taldea. Hizkuntzaren prozesamendua Wed, 31 May 2023 21:32:01 +0000 eu hourly 1 https://wordpress.org/?v=4.9.23 https://www.unibertsitatea.net/blogak/ixa/files/2018/10/ixa.jpg hizkuntza-baliabideak – Hizkuntza-teknologiak, Ixa Taldearen bloga https://www.unibertsitatea.net/blogak/ixa 32 32 Linguatec AI Bikaintasun-Sarea (2021-06-18) https://www.unibertsitatea.net/blogak/ixa/2021/10/08/linguatec-ai-bikaintasun-sarea-2021-06-18/ https://www.unibertsitatea.net/blogak/ixa/2021/10/08/linguatec-ai-bikaintasun-sarea-2021-06-18/#comments Fri, 08 Oct 2021 12:09:32 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=3028

Bukatu da aurten LINGUATEC proiektu europarra. Proeiktuaren xedea okzitanieraren, aragoieraren eta euskararen digitalizazio-maila hobetzea izan da, eta neurri handi batean lortu dugu helburua.

  • 2021eko maiatzeko workshopean emaitza zientifikoak konpartitu genituen komunitate akademikoarekin,
  • Ekaineko biltzar publikoan Linguatec AI Bikaintasun-Sarea sortu genuen proiektuko kideen artean, 2018-2021 urteetan egin dugun lankidetza-lan eredugarriari jarraipena emateko.
Linguatec sarearen erakunde sortzaileen ordezkariak: Elhuyar fundazioa, Aragoiko Gobernua, Okzitaniako Tolosako CRNS goi mailako ikerketa zentroa, Euskaltzaindia, Lo Congrés okzitanieraren akademia eta EHUko Ixa taldea. (Naiz, 2021-06-19)

Sare berria sortzeko adierazpena lau hizkuntzatan idatzi genuen (espainieraz, frantsesez, okzitanieraz eta euskaraz, LINGUATEC-AI_ES-EU-FR-OC.pdf). Hau da euskarazko bertsioa:

 

LINGUATEC AI BIKAINTASUN-SAREA

Adimen Artifiziala Hizkuntzan Mugaz Gaindiko Bikaintasun Sarea eratzea (Pirinioez gaindiko hizkuntza-azpiegitura eraikitzeko lankidetza teknologikoa)

Pirinioetako Lan Elkartearen lurraldea eraikitzen ari diren mugaz gaindiko proiektua da, eta 15 milioi herritarrek baino gehiagok partekatzen dituzte 6 hizkuntza eta horien tokiko barietateak. Eleaniztasuna gure lurraldeko aktiborik handienetako bat da, eta erronka garrantzitsuenetako bat ere bada, kulturaren eta ekonomiaren ikuspegitik kohesionatutako lurralde bat sortzeko. Gauza bera gertatzen da Europan, non hogeita lau hizkuntza ofizial eta 60 hizkuntza gutxitu baino gehiago osatzen duten eremu eleaniztun aberatsa baita; garai batean, eleaniztasuna komunikazioa eta informazioaren zirkulazio librea zailtzen zituzten hizkuntza-oztopo gisa ikusi ziren.

Adimen artifiziala hizkuntza eguneroko produktu digital askotan erabiltzen da, gehienak hizkuntzaz baliatzen baitira. Komunikazio mugikorrek, sare sozialek, laguntzaile adimendunek eta ahotsean oinarritutako interfazeek herritarrak, enpresak eta administrazio publikoak mundu digitalean elkarreraginean aritzeko modua aldatzen ari dira

Hizkuntza-teknologiek eraginkortasunez laguntzen dute Europako herritar guztien (eta Pirinioetako Lan Elkartearen lurraldearen) arteko berdintasuna lortzen eguneroko bizitzan, edozein dela ere hitz egiten duten hizkuntza. Nahiz eta hizkuntza gutxituek asko duten irabazteko hizkuntza-teknologiekin, egoera teknologiko ahula dute abiapuntu; izan ere, hizkuntza horiek digitalki garatzeko behar diren tresna eta baliabideak oso urriak dira, eta, kasu batzuetan, ez dira existitzen. 2018ko irailaren 11n Europako Parlamentuak onartutako ebazpenean (“On language equality in the digital age” 2018/2028(INI)) argiki egiaztatu du Europako hizkuntzen artean desoreka dagoela hizkuntzaren teknologien barruan, eta ekintzarako deia egin du, hizkuntzen arteko arrakala horiek lehenbailehen gainditzeko.

Hizkuntza baten garapena, eta beraz, hizkuntza horretatik elikatzen den kultura, erabat loturik dago hizkuntza horrek ingurune moderno eta aldakorretan, hala nola mundu digitalean funtzionatzeko duen gaitasunarekin. Hala, hizkuntza- eta kultura-aniztasuna estu lotuta dago mundu digitalean hizkuntza batek dituen gaitasun eta baliabideekin, hau da, gure kasuan mugaz gaindiko hizkuntza-azpiegitura sortzearekin. Hori dela eta, oso garrantzitsua da hizkuntza-oztopoak gainditzea eta, hartara, Pirinioetako Lan Elkartearen lurraldeko hizkuntzak indartzea, lurraldeak duen balio ekonomiko, kultural eta linguistikoa osorik bultzatu ahal izateko.

Lurraldeko hizkuntza guztientzat euskarri teknologiko egokia bermatzeak enplegua sortuko dugu, hazkuntza, aukerak, kulturarteko harremanak eta nazioarteko erreferentzialtasuna.

Era berean, funtsezkoa da ingurune digitaleko hizkuntza-oztopoak gainditzea, funtsezkoa baita gizarte inklusiborako eta aniztasunari batasuna eta kohesioa emateko urte askoan.

Linguatec AI Bikaintasun Sarearen xedea

Adimen Artifiziala Hizkuntza Mugaz Gaindiko Bikaintasun Sarea sortzea, lankidetza teknologikoaren bidez Pirinioez gaindiko hizkuntza-azpiegitura eraikitzen laguntzeko.

Helburuak

1. LINGUATEC bezalako mugaz gaindiko proiektuen beharra balioan jarri eta transmititzea, gure lurraldearen aberastasun eleaniztunak balio ekonomiko, turistiko eta kulturala sortzen baitu. Hau da, hizkuntza-hesia gainditzea eta ahaleginak batzea gure kultura- eta hizkuntza-aberastasuna motor ekonomiko gisa aprobetxatzeko.

2. Agenda estrategiko baten oinarriak eta ibilbide-orri bat ezartzea, hizkuntza-berdintasun digitala errealitate izan dadin Pirinioetako Lan Elkartearen lurraldean 2030ean.

3. Euskararen, katalanaren, aragoieraren eta okzitanieraren arteko lankidetza estua abiaraztea, guztiek oinarri teknologiko nahikoa izan dezaten, eta, hartara, pertsona bakoitzak bere hizkuntzan eroso parte har dezan mundu digitalean.

4. Adimen artifizialak hizkuntza eskaintzen dizkigun aukerak eta ahalmenak gizarteratzea, lurralde kohesionatua, integratzailea, eleaniztuna eta adimenduna lortzeko.

5. Adimen artifizialean azken belaunaldiko ezagutza eta teknologia sortzea, enpresek, erakundeek eta gizarte-erakundeek teknologiaren ahalmena aprobetxa dezaten Pirinioetako Lan Elkartearen lurraldearen garapen ekonomiko, sozial eta instituzionalerako.

6. Beste lurralde eleaniztun batzuetan, Europan zein mundu osoan, Pirinioetako Lan Elkartearen lurraldean lortutako lorpenak zabaltzea, esperientzia, prestakuntza, aholkularitza eta teknologia eskainiz.

7. Pirinioetako Lan Elkartearen lurraldea erreferentzia garrantzitsu bihurtzea hizkuntza-teknologietan baliabide urriak dituzten hizkuntzentzat eta haren garapen digitalean aurrera egin nahi duten hizkuntzentzat.

]]>
https://www.unibertsitatea.net/blogak/ixa/2021/10/08/linguatec-ai-bikaintasun-sarea-2021-06-18/feed/ 1
Euskal WordNet hiztegi semantikoa “publiko” bihurtu dugu https://www.unibertsitatea.net/blogak/ixa/2014/06/13/euskal-wordnet-hiztegi-semantikoa-publiko-bihurtu-dugu/ https://www.unibertsitatea.net/blogak/ixa/2014/06/13/euskal-wordnet-hiztegi-semantikoa-publiko-bihurtu-dugu/#comments Fri, 13 Jun 2014 12:44:43 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=1545 Itzulpen automatikoari, informazio-erauzketari eta hitzen adieren desanbiguazioari ganoraz ekin ahal izateko, makinek betiko hiztegiak baino tresna informatiko boteretsuagoak behar dituzte. Helburu horiek lantzeko oso egokia den Euskal WordNet baliabidea, eta hori aste honetan doan jaitsi eta kontsultatzeko moduan jarri dugu IXA taldean.  Gure 25. urteurrena ospatzeko beste modu gehigarri bat 😉
Ea denon artean fruitu gehiago ateratzen diogun baliabide ahaltsu honi!

Euskal WordNet euskararentzat egin den lehen Ezagutza-Base Lexikala (EBL) da. Alegia, informazio lexikala eta semantikoa jasotzen eta antolatzen dituen “hiztegi semantikoa” edo biltegi bat. Datu-base baten antzekoa da, baina desberdintasuna da hiztegi batean jasotzen den informazioaz gain —hitzen adierak eta adiera horien definizioak eta adibideak— kontzeptuak elkarren artean harremanetan jartzen direla.

Adibidez, hatz hitza kontsultatuz gero, zera esaten digu: “gizakiaren eskua edo oina bukatzen den bost zatietako bakoitza” da. Hori da esanahia, baina horretaz gain, beste hitzekin dituen erlazioen biartez hainbat informazio ere jaso dezakegu: hatza gorputz-adar bat dela, hatz lodia hatz bat dela, hatzak eskuen zati bat direla, eskuak aldi berean besoaren zati bat direla, eta hatzak gauzak ukitzeko erabiltzen direla. Kontzeptu horrek beste hizkuntzetan dauzkan baliokideak ere lortu ditzakegu (digit, dedo, dixito, dit). Azken finean, kontzeptu guztiak euren artean harremanetan jartzen dira hierarkikoki.

EuskalWordnet_hatz_eleanitza
“hatz” hitza kontsultatzen EuskalWordnet-en (zati bat)

Datu-base hori oso baliagarria da hainbat arlotan, hala nola, itzulpengintza automatikoan, informazio-erauzketan, hitzen adieren desanbiguazioan eta galdera-erantzun sistemetan. Itzulpen automatikoan, esaterako, sistemak ulertu behar du zer hitz ari den itzultzen eta horretarako horrelako “hiztegi semantiko” baten beharra dauka. Ezinbestekoa da hitz batek dituen adieretatik egokiena bereiztea kalitatezko itzulpena bermatzeko. WordNet erabilita egungo itzulpen automatikoen kalitate hobetzea da IXA taldearen ardura QTLeap proiektu europarrean.

HAP_diptiko_Irudia
HAP/LAP masterra

Euskal WordNet eta antzerako aplikazioak nola sortu eta nola erabili nahi dituenak horiek ikasi ahal izango ditu 2014-2015 ikasturtean UPV/EHUn IXA Taldeak emango duen Hizkuntzaren Azterketa eta Prozesamendua unibertsitate-masterrean. Ekainaren 30era arte dago izena emateko aukera http://ixa.si.ehu.es/master

]]>
https://www.unibertsitatea.net/blogak/ixa/2014/06/13/euskal-wordnet-hiztegi-semantikoa-publiko-bihurtu-dugu/feed/ 1
31 eskutik bloga https://www.unibertsitatea.net/blogak/ixa/2013/04/26/31-eskutik-bloga/ https://www.unibertsitatea.net/blogak/ixa/2013/04/26/31-eskutik-bloga/#respond Fri, 26 Apr 2013 13:25:14 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=1004 31 eskutik bloga EIZIEk jarri zuen abian 2012an, egunero euskararen erabilerari buruzko testu bat argitaratzeko, xede gutxi-asko didaktikoz idatzia.

31eskutikTalde-bloga da, egunero testu bat jartzeko, 31 lagunek idazten dute, hilean behin. Alor askotako kideak bildu dira: irakaskuntzakoak, komunikabideetakoak, itzultzaileak, idazleak, ikertzaileak, hiztegigileak…
Ixa taldeko kidea den Itziar Aduriz Agirre, Bartzelonako Unibertsitateko irakaslea eta UEUkidea dena, martxoan hasi da blog horretan. Honezkero bi artikulu bidali ditu

  • Euliak eta Kanoiak. Teoria-hizkuntzalaritza eta hizkuntzalaritza praktikoaren arteko harremanaz aritzen da. Anekdota bat ere kontatzen du: Hizkuntzalaritza konputazionala Euskaltzaindiko biltzar batean estreinakoz aurkeztuta, Piarres Xarriton altxatu eta bere iritzia bota zuen: ez ote ginen ari euliak kanoikadaz hil nahian.
  • Tristura. Kontakizun goxoa euskarazko tristura hitz horren itzulpena zein zaila den aurkezteko.  “… «ama, zer duzu?» galderari, «tristura» erantzuten zuen, eskua sabelaren gainean jartzen zuen bitartean”

Igone Zabala Ixakide berriak ere berri batzuk bidali ditu 31 eskutik blogera:

  • Corpusak eta hiztegiak artikuluan corpus eta hiztegien mugak aztertzen ditu estimatu / estimazio / estimatzaile lemen adierak aztertuta.“Hiztegiek corpusek egiten dituzten argazkiak interpretatzen dituzte eta zenbat eta argazki gehiago eta enfokatuago eduki, orduan eta informazio hobea eskainiko diete erabiltzaileei.”
  • Corpusen adierazgarritasuna artikuluan agurtzen ditu 2013an argitaratu diren corpus handi berriak “ezinezkoa zait ezikusia egitea urte honen hasieran euskal corpusgintzak eman digun uzta oparoari“. Eta eztabaidatzen du ea Egungo Testuen Corpusa (ETC) corpusa benetan ereduzkoa edo nonbait oportunista den.

Blog interesgarria da. Hizkuntza-teknologiaren bidez sortutako baliabideak aipatu, erabili eta eztabaidatzen dira bertan. Gure blogeko esteken artean sartu dugu.

 

]]>
https://www.unibertsitatea.net/blogak/ixa/2013/04/26/31-eskutik-bloga/feed/ 0
Mintegia: Terminoen erregistro akademikoen garapena aztertzeko lan-ingurunea(2013/02/28) https://www.unibertsitatea.net/blogak/ixa/2013/02/19/garaterm/ https://www.unibertsitatea.net/blogak/ixa/2013/02/19/garaterm/#respond Tue, 19 Feb 2013 14:56:50 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=890 Gaia: GARATERM: erregistro akademikoen garapena aztertzeko lan-ingurunea
Hizlaria: Igone Zabala
Eguna: Otsailak 28, osteguna
Ordua: 15:00
Tokia:  3.2 gela. Informatika Fakultatea

Laburpena:
2008 urtean aurrera eraman zen GARATERM proiektua (EHU-EJIE deialdiko diru-laguntza). Proiektu horretan gogoeta orokorra egin zen euskara akademikoaren garapena, ikerketa eta didaktika uztartzeko plataforma bat osatzeko eman beharreko urratsez eta beharrezko liratekeen tresna eta baliabideez. Gogoeta horrekin batera etorri zitzaion orduko Euskal Filologia sailari (orain Euskal Hizkuntza eta Komunikazioa izena duenari) zeregin bat Euskara Errektoreordetzatik, alegia, Euskara Plan Gidarian aurreikusten ziren irakasleentzako tailerren ardura hartzea. Zeregin hori Garaterm proiektuaren ideiarekin uztartu zen, eta hasieran tailer huts modura pentsatuta zeudenak Terminologia Sareak Ehunduz esaten diogun programa bihurtu ziren apurka-apurka. 2011 eta 2012 urteetan Elhuyarrekin batera aurrera eraman den unibertsitate-gizartea proiektuaren bitartez eta TSE programan lortutako esperientziari esker, aurrera eraman ahal izan dira lehen proiektuan beharrezkotzat hartutako zenbait elementu. Hitzaldi honetan “Garaterm-2: Linguistikoki prozesatutako corpusetatik terminologia eta neologia erauzteko lan-ingurunearen garapena” proiektuaren helburuak, lorpenak eta aurrera begira egin beharrekoak azalduko dira.

]]>
https://www.unibertsitatea.net/blogak/ixa/2013/02/19/garaterm/feed/ 0
CLARIN proiektuaren bilera Euskal Herriko agenteekin https://www.unibertsitatea.net/blogak/ixa/2010/06/14/clarin-proiektuaren-bilera-euskal-herriko-agenteekin/ https://www.unibertsitatea.net/blogak/ixa/2010/06/14/clarin-proiektuaren-bilera-euskal-herriko-agenteekin/#respond Mon, 14 Jun 2010 20:33:27 +0000 https://www.unibertsitatea.net/blogak/ixa/clarin-meeting-http-wwwclarineu-external

 

Ixa Taldeak CLARIN proiektuaren bilera bat antolatu du  n  ekainaren 8an Donostian.  CLARIN proiektuaren helburua hizkuntza-baliabide konputazionalak zabaltzea da giza zientzietako ikerketetan erabiliak izan daitezen.

CLARIN

Bileraren helburuak bi izan dira:

  • Alde batetik, CLARIN proiektuaren zehaztasunak proiektuko arduradunen eskutik  zuzenean jasotzea Euskal Herrian. Horregatik izan dugu gure artean Steven Krauwer Utrecht-eko Institute of Linguistics zentroko ikertzailea eta CLARIN proiektuaren koordinatzailea. Eta horregatik izan dugu gure artean Pompeu Fabra Unibertsitateko Nuria Bel irakaslea, bera baita CLARIN proiektuko arduraduna estatu mailan.

  • Eta beste alde batetik, Euskal Herrian hizkuntzaren azterketa eta prozesamenduan aritzen garen taldeon lanak aurkeztea.

Bileran parte hartu dute Eusko Jaurlaritzako Hizkuntza Politikako zuzendaria den Lourdes Auzmendik, Begoña Muruaga zuzendariordeak, eta Araceli Díaz de Lezanak. Ikusle gisa  parte hartu dute  proiektuaren berri zehatzagoa izateko eta euskarak marko horretan egin dezakeen ekarpena neurtzeko.

Egitaraua hau izan da (egindako aurkezpen guztien fitxategiak hemendik eskuratu daitezke):

10:00etan, Steven Krauwer (CLARIN proiektua eta Utrecht Institute of Linguistic)

10:30etan, Nuria Bel (Pompeu Fabra Unibertsitatea). 

11:00etan, Atsedenaldia

11:30etatik -13:00etara Hemengo taldeen aurkezpenak (I)

  • Miriam Urkia. Euskaltzaindia
  • Miren Azkarate. Euskara institutua. UPV/EHU
  • Mikel Santesteban.  Gogo Elebiduna. UPV/EHU
  • Antton Gurrutxaga eta  Iñaki San Vicente.  Elhuyar I+G

13:00etan: Luncha

14:00etatik-15:00etara Hemengo taldeen aurkezpenak (2. saioa)

  • Igone Zabala. Euskal Filologia saila. UPV/EHU
  • Ibon Aizpurua. Eleka.
  • Jon Sánchez. Aholab. UPV/EHU.
  • Kepa Sarasola. IXA Group. UPV/EHU

15:00-15:30: Jardunaldiaren ondorioak. Arantza Diaz de Ilarraza

CLARIN meeting Donostia10

Argi geratu da egun euskararako ditugun baliabide eta tresnak baliagarriak direla CLARIN proiekturako, baita Europa mailan sortzen ari diren antzeko proiektuetarako ere. Horrela adierazi dute Stephen Krawer eta Nuria Bell  arduradunek.

Parte hartzaileek zuzenean ezagutu dituzte proiektuaren arduradunak eta horiekin itunak sinatu ahal izango dituzte hemendik aurrera.

Gure ustetan CLARIN proiektua interesgarria da, Europako hainbat estatuk bermatua da eta, etorkizunari begira, baliagarria euskararen baliabideak zabaltzeko eta homologatzeko.

]]>
https://www.unibertsitatea.net/blogak/ixa/2010/06/14/clarin-proiektuaren-bilera-euskal-herriko-agenteekin/feed/ 0