hizkuntza-teknologiak – Hizkuntza-teknologiak, Ixa Taldearen bloga https://www.unibertsitatea.net/blogak/ixa IXA taldea. Hizkuntzaren prozesamendua Wed, 31 May 2023 21:32:01 +0000 eu hourly 1 https://wordpress.org/?v=4.9.23 https://www.unibertsitatea.net/blogak/ixa/files/2018/10/ixa.jpg hizkuntza-teknologiak – Hizkuntza-teknologiak, Ixa Taldearen bloga https://www.unibertsitatea.net/blogak/ixa 32 32 Linguatec AI Bikaintasun-Sarea (2021-06-18) https://www.unibertsitatea.net/blogak/ixa/2021/10/08/linguatec-ai-bikaintasun-sarea-2021-06-18/ https://www.unibertsitatea.net/blogak/ixa/2021/10/08/linguatec-ai-bikaintasun-sarea-2021-06-18/#comments Fri, 08 Oct 2021 12:09:32 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=3028

Bukatu da aurten LINGUATEC proiektu europarra. Proeiktuaren xedea okzitanieraren, aragoieraren eta euskararen digitalizazio-maila hobetzea izan da, eta neurri handi batean lortu dugu helburua.

  • 2021eko maiatzeko workshopean emaitza zientifikoak konpartitu genituen komunitate akademikoarekin,
  • Ekaineko biltzar publikoan Linguatec AI Bikaintasun-Sarea sortu genuen proiektuko kideen artean, 2018-2021 urteetan egin dugun lankidetza-lan eredugarriari jarraipena emateko.
Linguatec sarearen erakunde sortzaileen ordezkariak: Elhuyar fundazioa, Aragoiko Gobernua, Okzitaniako Tolosako CRNS goi mailako ikerketa zentroa, Euskaltzaindia, Lo Congrés okzitanieraren akademia eta EHUko Ixa taldea. (Naiz, 2021-06-19)

Sare berria sortzeko adierazpena lau hizkuntzatan idatzi genuen (espainieraz, frantsesez, okzitanieraz eta euskaraz, LINGUATEC-AI_ES-EU-FR-OC.pdf). Hau da euskarazko bertsioa:

 

LINGUATEC AI BIKAINTASUN-SAREA

Adimen Artifiziala Hizkuntzan Mugaz Gaindiko Bikaintasun Sarea eratzea (Pirinioez gaindiko hizkuntza-azpiegitura eraikitzeko lankidetza teknologikoa)

Pirinioetako Lan Elkartearen lurraldea eraikitzen ari diren mugaz gaindiko proiektua da, eta 15 milioi herritarrek baino gehiagok partekatzen dituzte 6 hizkuntza eta horien tokiko barietateak. Eleaniztasuna gure lurraldeko aktiborik handienetako bat da, eta erronka garrantzitsuenetako bat ere bada, kulturaren eta ekonomiaren ikuspegitik kohesionatutako lurralde bat sortzeko. Gauza bera gertatzen da Europan, non hogeita lau hizkuntza ofizial eta 60 hizkuntza gutxitu baino gehiago osatzen duten eremu eleaniztun aberatsa baita; garai batean, eleaniztasuna komunikazioa eta informazioaren zirkulazio librea zailtzen zituzten hizkuntza-oztopo gisa ikusi ziren.

Adimen artifiziala hizkuntza eguneroko produktu digital askotan erabiltzen da, gehienak hizkuntzaz baliatzen baitira. Komunikazio mugikorrek, sare sozialek, laguntzaile adimendunek eta ahotsean oinarritutako interfazeek herritarrak, enpresak eta administrazio publikoak mundu digitalean elkarreraginean aritzeko modua aldatzen ari dira

Hizkuntza-teknologiek eraginkortasunez laguntzen dute Europako herritar guztien (eta Pirinioetako Lan Elkartearen lurraldearen) arteko berdintasuna lortzen eguneroko bizitzan, edozein dela ere hitz egiten duten hizkuntza. Nahiz eta hizkuntza gutxituek asko duten irabazteko hizkuntza-teknologiekin, egoera teknologiko ahula dute abiapuntu; izan ere, hizkuntza horiek digitalki garatzeko behar diren tresna eta baliabideak oso urriak dira, eta, kasu batzuetan, ez dira existitzen. 2018ko irailaren 11n Europako Parlamentuak onartutako ebazpenean (“On language equality in the digital age” 2018/2028(INI)) argiki egiaztatu du Europako hizkuntzen artean desoreka dagoela hizkuntzaren teknologien barruan, eta ekintzarako deia egin du, hizkuntzen arteko arrakala horiek lehenbailehen gainditzeko.

Hizkuntza baten garapena, eta beraz, hizkuntza horretatik elikatzen den kultura, erabat loturik dago hizkuntza horrek ingurune moderno eta aldakorretan, hala nola mundu digitalean funtzionatzeko duen gaitasunarekin. Hala, hizkuntza- eta kultura-aniztasuna estu lotuta dago mundu digitalean hizkuntza batek dituen gaitasun eta baliabideekin, hau da, gure kasuan mugaz gaindiko hizkuntza-azpiegitura sortzearekin. Hori dela eta, oso garrantzitsua da hizkuntza-oztopoak gainditzea eta, hartara, Pirinioetako Lan Elkartearen lurraldeko hizkuntzak indartzea, lurraldeak duen balio ekonomiko, kultural eta linguistikoa osorik bultzatu ahal izateko.

Lurraldeko hizkuntza guztientzat euskarri teknologiko egokia bermatzeak enplegua sortuko dugu, hazkuntza, aukerak, kulturarteko harremanak eta nazioarteko erreferentzialtasuna.

Era berean, funtsezkoa da ingurune digitaleko hizkuntza-oztopoak gainditzea, funtsezkoa baita gizarte inklusiborako eta aniztasunari batasuna eta kohesioa emateko urte askoan.

Linguatec AI Bikaintasun Sarearen xedea

Adimen Artifiziala Hizkuntza Mugaz Gaindiko Bikaintasun Sarea sortzea, lankidetza teknologikoaren bidez Pirinioez gaindiko hizkuntza-azpiegitura eraikitzen laguntzeko.

Helburuak

1. LINGUATEC bezalako mugaz gaindiko proiektuen beharra balioan jarri eta transmititzea, gure lurraldearen aberastasun eleaniztunak balio ekonomiko, turistiko eta kulturala sortzen baitu. Hau da, hizkuntza-hesia gainditzea eta ahaleginak batzea gure kultura- eta hizkuntza-aberastasuna motor ekonomiko gisa aprobetxatzeko.

2. Agenda estrategiko baten oinarriak eta ibilbide-orri bat ezartzea, hizkuntza-berdintasun digitala errealitate izan dadin Pirinioetako Lan Elkartearen lurraldean 2030ean.

3. Euskararen, katalanaren, aragoieraren eta okzitanieraren arteko lankidetza estua abiaraztea, guztiek oinarri teknologiko nahikoa izan dezaten, eta, hartara, pertsona bakoitzak bere hizkuntzan eroso parte har dezan mundu digitalean.

4. Adimen artifizialak hizkuntza eskaintzen dizkigun aukerak eta ahalmenak gizarteratzea, lurralde kohesionatua, integratzailea, eleaniztuna eta adimenduna lortzeko.

5. Adimen artifizialean azken belaunaldiko ezagutza eta teknologia sortzea, enpresek, erakundeek eta gizarte-erakundeek teknologiaren ahalmena aprobetxa dezaten Pirinioetako Lan Elkartearen lurraldearen garapen ekonomiko, sozial eta instituzionalerako.

6. Beste lurralde eleaniztun batzuetan, Europan zein mundu osoan, Pirinioetako Lan Elkartearen lurraldean lortutako lorpenak zabaltzea, esperientzia, prestakuntza, aholkularitza eta teknologia eskainiz.

7. Pirinioetako Lan Elkartearen lurraldea erreferentzia garrantzitsu bihurtzea hizkuntza-teknologietan baliabide urriak dituzten hizkuntzentzat eta haren garapen digitalean aurrera egin nahi duten hizkuntzentzat.

]]>
https://www.unibertsitatea.net/blogak/ixa/2021/10/08/linguatec-ai-bikaintasun-sarea-2021-06-18/feed/ 1
Ikastaro osagarria: Hizkuntz ingeniaritzaren arloko aplikazioak (Matrikulazio epea luzatuta) https://www.unibertsitatea.net/blogak/ixa/2014/12/30/ikastaro-osagarria-hizkuntz-ingeniaritzaren-arloko-aplikazioak/ https://www.unibertsitatea.net/blogak/ixa/2014/12/30/ikastaro-osagarria-hizkuntz-ingeniaritzaren-arloko-aplikazioak/#comments Tue, 30 Dec 2014 08:31:07 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=1741 HAP masterretik ikastaro hau zabaldu dugu publiko orokorrarentzat:

Hizkuntz ingeniaritzaren arloko aplikazioak.
Eskola saioak Hizkuntzaren Azterketa eta Prozesamendua masterreko saioen azpimultzo bat dira, aplikazio praktikoekin lotuta daudenena (itzulpen automatikoa, informazio-bilaketa, hizkuntzaren ikaskuntza…

Matrikulazio-epea/Plazo de matricula:  Urtarrilaren 12tik 23ra/ Del 12 al 23 de enero Urtarrilaren 12tik Otsailaren 7ra / Del 12 de enero al 7 de febrero
Idazkaritza amaia.lorenzo@ehu.es / patxi.salinas@ehu.es
Informazio teknikoa: montse.maritxalar@ehu.es
Loturak:

diptikoa-ikastaro-osagarria-Aplikazioak_1

diptikoa-ikastaro-osagarria-Aplikazioak_2

]]>
https://www.unibertsitatea.net/blogak/ixa/2014/12/30/ikastaro-osagarria-hizkuntz-ingeniaritzaren-arloko-aplikazioak/feed/ 1
#txiotesia. Hizkuntza-teknologia arloko tesiak https://www.unibertsitatea.net/blogak/ixa/2013/11/22/txiotesia-hizkuntza-teknologia-arloko-tesiak/ https://www.unibertsitatea.net/blogak/ixa/2013/11/22/txiotesia-hizkuntza-teknologia-arloko-tesiak/#comments Fri, 22 Nov 2013 13:56:24 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=1264

Unibertsitatea.net atariak antolatu zuen  #txiotesia ekimenean gutxienez 9 izan dira hizkuntza teknologiaren inguruko tesiak. Azaroaren 19an ospatu zen lehiaketan 86 ikertzailek hartu zuten parte eta hauek dira HT arloan guk jaso ditugun txioak.
Lehiaketaren sari banaketa ekitaldia Donostiako Koldo Mitxelenan izango da datorren astelehenean.
  1. Izenburua: Informazio linguistikoaren adierazpen-ereduak datuen prozesaketa masiborako. #txiotesia
  2. Lan hau hizkuntzaren prozesamenduaren (HP) arloan kokatzen da. HPri esker itzulpen automatikoa bezalakoak lortu dira. #txiotesia
  3. HPko aplikazioek testu-kopuru masiboekin lan egin behar izaten dute (corpusak). Gaurko prozesamendu-algoritmoak mugatuta daude. #txiotesia
  4. Tesiaren 1. helburua: HPko tresnen arteko informazio-trukearen oinarri izango den informazio linguistikoa formalizatzea. #txiotesia
  5. Tesiaren 2. helburua: Makina bat baino gehiagotan paraleloan banatuko diren algoritmoen diseinua, prozesaketa masiboa helburu. #txiotesia
  6. Hizkuntzarekin lotutako aplikazioek ahalmen handiagoa izanen dute baliabide-kopuru erraldoiekin lan egiteko, aplikazioa hobetuz #txiotesia
  1. Hedapena informazioaren berreskurapen (IB) sistemetan: hitzen adiera-desanbiguazioaren eta antzekotasun semantikoaren ekarpenak #txiotesia
  2. IB sistema: ordenagailuan edo interneten informazioa bilatzeko tresna; adib Google. Hitz batzuk idatziz egingo dugu bilaketa…#txiotesia
  3. … eta sistemak hitz horiek bakarrik erabiliko ditu bilaketan: hitzak agertzen badira, dokumentua itzuliko du, bestela ez #txiotesia
  4. Arazoaren adib: “hontz” jarrita, “mozolo” duen testurik ez du itzuli (baina hauek ere nahiko genituzke) #txiotesia pic.twitter.com/RS1c4w3bNG Embedded image permalink
  5. Sistemak “hontz” jartzean bere sinonimoa den “mozolo” ere bilatuko balu, emaitzan hontzak eta mozoloak 🙂#txiotesia pic.twitter.com/Wjeho8fMjD
  6. Ordenagailuari hizkuntzaren ezagutza gehituz (adib sinonimia, hitzen esanahia), IB sistemen bilaketak hobeak direla frogatu da #txiotesia

Itziar Aldabe@jibalari 19 Nov

  1. Gramatika eta hiztegia lantzeko ariketen sorkuntza automatikoa, hizkuntzalaritza konputazionala jorratuz – ArikIturri tresna #txiotesia
  2. “Itsasoko ………… , esaterako, CO2 asko “irensten” du fotosintesia egitean.” a) florak b) planktonak c) animaliak d) landareak #txiotesia
  3. Zientzia-hiztegia; Distraigarrien sorkuntza automatikoa; Antzekotasun neurrien aplikazioa; Sistemaren ebal.:DBH2ko 951 ikasle #txiotesia
  4. “Jarraitu baino lehen ………… naizela esan behar dut.” a) rock zalea bat b) rock zale bat c) rocka zalea bat #txiotesia
  5. Gramatika ariketak: dekl., determ., aditzen erabilera;Adituen jakintza/corpusetatik jasotako erroreak; Ebal: euskara irakasleak #txiotesia
  6. ArikIturri: irakasleei ariketak sortzen laguntzeko tresna erabilgarria. HAP; Aplikazio domeinuak: Euskara; Zientzia @IxaTaldea #txiotesia

  Manex@zumarraga14

  1. Hizkuntzalaritza konputazionaleko teknikak poesia edo bertso sortzaile automatikora bidean #txiotesia
  2. Posible al da konputagailuak poesia sortu eta naturala izatea? Turingek antzeko zerbait planteatu zuen http://ttiki.com/57375  #txiotesia
  3. Bertsolaritzaren inguruan lanean gabiltza: Bertsotarako arbel digitala, bilatzaile semantikoak, txapelketa nagusien azterketa #txiotesia
  4. Kutxa beltz bat garatu nahi dugu, goitik behera bertsoak analizatuko dituena eta behetik gora bertsoak sortu. #txiotesia
  5. Bertso kutxa hau garatzeko bide ezberdinak jorratuko ditugu: Bide klasikoa eta estatistikoa #txiotesia
  6. Konputagailua izango ote da egunen batean bertso ulergarri eta naturalak sortzeko gai? #txiotesia
  1. Egitura sintaktiko konplexuen identifikazioa eta sinplifikazioa euskararen tratamendu automatikoan #ŧxiotesia
  2. Esaldi luzeek eta konplexuek arazoak sortzen dituzte tratamendu automatikoan, horiek aztertu eta sinplifikazioak proposatu #txiotesia
  3. Zeintzuk dira eus. egitura konplexuak? Automatikoki posible? Proposamena: Konplexutasun neurriak erabili #txiotesia pic.twitter.com/hU7Ah8wYyD
  4. Automatikoki sinplifikatzeko, egituren azterketa euskarazko corpusetan (adb. EPEC) eta erdaratan egindako lanetan oinarrituz
  5. Automatiko sortuko diren esaldi eta testu berriek ahal den neurrian jatorrizkoa esaldiaren esanahia mantendu behar dute.
  6. Esaldi sinpleak automatikoki itzultzean emaitza hobeak lortu
  1. Aditzen inguruko informazio lexikala aplikatuta anbiguotasun sintaktikoen ebazpenean
  2. Emazteak:Maitea, niregatik erretzeari utziko zenioke?(anbiguoa) Senarrak:Eta nondik atera duzu zuregatik erretzen dudala?
  3. Umore egiteko sarri erabiltzen den anbiguotasuna, hizkuntzaren ordenagailu bidezko prozesamenduan arazoa bihurtzen da.
  4. Gizakiok, komunikatzeko anbiguotasunari aurre egiten diogu esfortzurik gabe ezagutza ugari eta heterogeneoa baliatuz
  5. Hizkuntzaren prozesamendu automatikoa burutzeko anbiguotasuna ebazteko erabilgarria den informazio antzematea beharrezkoa da
  6. Anbiguotasun sintaktikoa ebazteko aditzek gainontzeko elementuekiko maiztasunaren erabilgarritasuna probatu da #txiotesia
  1. Erlazio Erauzketa (EE): Eskuzko Lana Arintzeko Teknikak #txiotesia
  2. EE: Esaldi batean, bi entitateren artean erlazio semantikorik dagoen jakitea da, eta hala bada, erlazio horri izen bat eman #txiotesia
  3. Guzti hau konputazionalki. Adibidez:
  4. EE oso baliagarria da galdera-erantzun sistemetarako, textu sinplifikaziorako, ezagutza-oinarriak aberasteko,…
  5. Ordenagailuak eskuz etiketatutako korpusen bidez ikasten du EE, nahiz eta sistema onenak izan, oso garestiak dira
  1.  Osasun-txostenak euskaraz sortzeko baliabideak: terminologiaren euskaratzea, idazketerako laguntza eta itzulpen automatikoa
  1. Web-a euskarazko corpus gisa #txiotesia
  2. Testu-corpusak beharrezko dira hizkuntza baten garapenean, baina euskarazk corpusak, orokorrean, gutxi eta txikiak dira
  3. Hizkuntz teknologiak erabilita eta web-a iturri gisa hartuta euskarazko corpusak osa daitezke modu automatikoan?
  4. Tesian, web-a euskarazko corpus gisa kontsultatzeko zerbitzua (http://www.corpeus.org ) eta corpus espezializatuak, orokorrak … #txiotesia
  5. … eta konparagarriak biltzeko tresnak garatu dira; mota horietako hainbat corpus bildu dira (200 milioi hitzeko bat barne) #txiotesia
  6. Hizkuntz teknologia bidezko metodo automatikoek eta web-ak lagun dezakete euskarazko corpusen egoera hobetzen, eta egin dute #txiotesia
  1. Idiomatikotasunaren karakterizazio automatikoa: izen+aditz konbinazioak. Fraseologia konputazionala Elhuyar/IXA 2014an aurkeztu#txiotesia
  2. Lokuzioak eta kolokazioak unitate “idiomatikoak” dira, ez “libreak” Ikus idiomatikotasunaren continuuma #txiotesia pic.twitter.com/iDEsEgYr6O
    Embedded image permalink
  3. Xedea: konbinazioak testuetatik AUTOMATIKOKI lortu, ordenatu eta sailkatu Testuak:72M hitz(Egunk+Berria) #txiotesia
    Embedded image permalink
  4. Teknikak 1 agerkidetza; 2 “gardentasun” semantikoa; 3 sintaktikoki malgua den; 4 osagaiak ordezkatzerik? #txiotesia pic.twitter.com/nDqLfIHb6S

    Embedded image permalink

  5. Ebaluazioa: ausaz hautatutako 1200 bigrama, hiru adituk sailkatuta (lok/kol/lib) Banaka, onena semantika #txiotesia pic.twitter.com/txVzGMNhA9
    Embedded image permalink
  6. Ikasketa automatikoa: ezaugarriak konbinatuz hobetzen da sailkapena Ekarpen handiena, semantikak http://bit.ly/1cDJASk  #txiotesia
]]>
https://www.unibertsitatea.net/blogak/ixa/2013/11/22/txiotesia-hizkuntza-teknologia-arloko-tesiak/feed/ 2
2012ko hizkuntzen teknologien datuak (LANGUNE) https://www.unibertsitatea.net/blogak/ixa/2013/08/30/2012ko-hizkuntzen-teknologien-datuak-langune/ https://www.unibertsitatea.net/blogak/ixa/2013/08/30/2012ko-hizkuntzen-teknologien-datuak-langune/#respond Fri, 30 Aug 2013 12:05:04 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=1142 Langune2012

 

LANGUNEk, Hizkuntzen Industriaren alorreko Euskal Herriko enpresen elkartea, 2012ko txosten sektoriala plazaratu berri du.

 

Txostenaren arabera, 2012. urtean sektoreko enplegua mantendu egin da (%0,2an baino ez da murriztu) eta fakturazioa %1,8an handiagotu da.

 

Hizkuntzen Industrien inguruan 4.995 langile daude Euskadiko Elkarte Auronomikoan egun, eta 2013rako aurrikuspena apur bat handitzea da 5.045 enplegu lortu arte.

 

Langune2012_Fakturazioa2

 

 

 

 

Sektoreak 276 miloi euro fakturatu ditu 2012an. Irudian ikus daiteke lau segmentuetako bakoitzean aurreko urtearekin izan den aldaketa.

 

 

 

Txostenean agertzen diren beste datu batzuk ere LANGUNE elkartearen webgunetik lortu daitezke.

Gora doa Hizkuntzen Teknologia, 37 bazkide hauek biltzen dira Langune elakrtean:

Langune_Kideak

 

]]>
https://www.unibertsitatea.net/blogak/ixa/2013/08/30/2012ko-hizkuntzen-teknologien-datuak-langune/feed/ 0
TC3 aldizkarian argitaratu dugu Berbatek proiektuko uzta https://www.unibertsitatea.net/blogak/ixa/2013/06/27/tc3-aldizkarian-argitaratu-dugu-berbatek-proiektuko-uzta/ https://www.unibertsitatea.net/blogak/ixa/2013/06/27/tc3-aldizkarian-argitaratu-dugu-berbatek-proiektuko-uzta/#comments Thu, 27 Jun 2013 11:28:13 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=1104 TC·_2013_BerbatekTranslation: Computation, Corpora, Cognition (TC3) aldizkari berriak itzulpengintzako lanak argitaratzen ditu modu elektronikoan eta atzipen libreko filosofiarekin.

TC3 aldizkari honek argitaratu berri du gure artikulu bat non ETORTEK deialdiko Berbatek proiektuan sortu genituen demoak deskribatzen ditugun. Proiektuaren garapenean darabilgun filosofia ere azaltzen dugu artikuluan.

Hiru demo hauek prestatu eta aurkeztu genituen prentsaurreko batean:

Artikulua TC3 aldizkariko ale berezi batean atera da:
Vol 3, No 1 (2013): Special Issue on Language Technologies for a Multilingual Europe
Hau da: Europa eleaniztunarentzako Hizkuntza Teknologiak.

Beraz… ondo kokatuta dago gure artikulu hori 🙂

The BerbaTek project for Basque: Promoting a less-resourced language via language technology for translation, content management and learning
Translation: Computation, Corpora, Cognition (TC3) journal. Vol 3, No 1, pp: 119-135 (2013). http://www.t-c3.org/index.php/t-c3/article/view/24/34

Eman eta zabal zazu

 

 

]]>
https://www.unibertsitatea.net/blogak/ixa/2013/06/27/tc3-aldizkarian-argitaratu-dugu-berbatek-proiektuko-uzta/feed/ 7
Aro digital honetan nola dago euskara? (META-NET liburua) https://www.unibertsitatea.net/blogak/ixa/2013/03/21/euskara-aro-digitalean/ https://www.unibertsitatea.net/blogak/ixa/2013/03/21/euskara-aro-digitalean/#comments Thu, 21 Mar 2013 18:36:19 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=989 Europa mailan Hizkuntzaren Prozesamenduan koordinazio-lanak egiten dituen META-NET sareak 30 “liburu zuri” argitaratu ditu alor honetan Europako hizkuntzen egoera aztertzearren. Horietako bat euskararena da, orain dela gutxi argitaratu dena:

“Euskara Aro Digitalean” liburua

Inmaculada Hernáez, Eva Navas, Igor Odriozola, Kepa Sarasola, Arantza Diaz de Ilarraza, Igor Leturia, Araceli Diaz de Lezana, Beñat Oihartzabal, Jasone Salaberria  2012
The Basque language in the digital age / Euskara aro digitalean
METANET White Paper Series.
Georg Rehm, Hans Uszkoreit (editors). Springer.

METANET_White_Papers_Basque.pdf

Liburuaren egile eta koordinatzaile nagusia izan den Inma Hernaezek laburpentxo hau egin du:

Oro har, META-NETen ikerketa-lanak ohartarazten du Europako hizkuntza gehienak digitalki iraungitzeko arriskuan daudela, aztertutako 30 hizkuntzetako 21ek duten babes digitala “hutsa” edo, kasurik onenean, “eskasa” baita.

Azterketak agerian uzten du hizkuntza batek ere ez duela “babes bikaina”; ingelesa baino ez da jo “babes ona” duen hizkuntzatzat, eta haren atzetik daude alemana, espainiera, frantsesa, italiera eta nederlandera, “babes ertainaz”. Bestalde euskarak, katalanak eta galegoak, bulgariera, greziera, hungariera eta polonierarekin batera, “babes zatikatua” dute, eta, hortaz arrisku handiko hizkuntzen multzoan ezarri dira horiek ere.

META-NETen arabera, ezinbestekoa da Europan ekimen koordinatu eta eskala handiko bat sortzea, dauden hutsuneak beteko baditugu eta teknologia ahalik eta hizkuntza gehienetara transferituko badugu. Izan ere, biztanleko karga finantzarioa oso handia da hizkuntza-komunitate txikienentzat; hizkuntzen artean teknologiak trukatu beharra dago; nabarmena da baliabideen, tresnen eta zerbitzuen elkarreragingarritasun falta; eta bistakoak dira hizkuntza-mugak eta muga politikoak maiz bat ez etortzearen ondorioak.

]]>
https://www.unibertsitatea.net/blogak/ixa/2013/03/21/euskara-aro-digitalean/feed/ 2
Mintegia: Kitxuaren prozesamendurako lehen hurbilketa (2012/11/15) https://www.unibertsitatea.net/blogak/ixa/2012/11/12/mintegia-kitxuaren-prozesamendurako-lehen-hurbilketa/ https://www.unibertsitatea.net/blogak/ixa/2012/11/12/mintegia-kitxuaren-prozesamendurako-lehen-hurbilketa/#comments Mon, 12 Nov 2012 14:55:31 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=759 Bada ia urtebete Ixa Taldea ea Cuscoko UNSAAC unibertsitateko Juan Cruz ikertzailearen artean kitxuaren prozesamenduari ekiteko lanean hasi ginela.  Euskara eta kitxua  biak baliabide gutxiko hizkuntzak direnez eta morfologia antzekoa dutenez, euskara normalizatzeko eta bere erabilera errazteko azken 20 urtetan hemen egin ditugun tresnak eta aplikazioak baliagarri izan daitezke kitxuaren kasuan ere. Madrileko “Ministerio de Asuntos exteriores y Cooperación”-en proiektu bat izan dugu 2012 urtean: Lehen urratsak Quechua-ren prozesaketa automatikoan. Corpus, morfologia eta lexikoa. Proiektu horren barruan Kepa, Xabier eta Olatz Cuscon egon gara urtean zehar, eta irailetik hona bisitan dauzkagu Hugo Quispe  eta Richard Castro. Hugo datu base lexikal bat garatzen ari da kitxuarako, eta Richard hizketa sortzeko beste sistema bat eraiki du Bilboko Aholab laborategian. Richard-ek datorren astean Iberspeech2012 kongresuan demo bat aurkeztuko du hizketa sortzeko eginda zeukaten beren lehen sistemarekin. Osteguneko mintegi-saioan proiektu honen barruan egin dena azalduko dugu.

Richard eta Hugo Aholab laborategian

Gaia: Kitxuaren prozesamendurako lehen hurbilketa
(Primera aproximación al procesamiento automático del Quechua)
Hizlaria: Hugo Quispe, Richard Castro (UNSAAC unibertsitatea),
Olatz Arregi,  Xabier Artola eta  Kepa Sarasola (Ixa Taldea)
Eguna: azaroaren 15ean, osteguna
Ordua: 16:00-17:00
Tokia:  3.2 aretoa. Informatika Fakultatea


Laburpena:
El Quechua o “Runasimipi” como lengua oriunda de la cultura Inca en el Perú, es una familia de lenguas en Latinoamérica. La situación actual de la lengua, por factores como la occidentalización entre otros, ha hecho que el quechua sea una lengua vulnerable, en vías de extinción.

Un grupo de profesores e investigadores del grupo IXA de la UPV/EHU, en conjunto con la UNSAAC en Cusco, Perú, estamos realizando un trabajo para sentar las bases de lo que pretende ser el centro de ingeniería lingüística de Cusco. Se trata de desarrollar los primeros recursos básicos y herramientas para al procesamiento automático del quechua. Los temas en los que estamos trabajando son: recopilación de un corpus textual, una base de datos léxica para la lengua quechua (BDLQ) y futuras herramientas derivadas de la misma, uso de la herramienta FOMA en el análisis morfológico y creación de un TTS como herramientas básicas para el tratamiento de la lengua.

De esta manera, se ha consolidado las bases de apoyo y trabajo en equipo entre las dos universidades, en bien de una lengua en situación crítica.

Cuscoko taldea 2012ko urtarrilean
]]>
https://www.unibertsitatea.net/blogak/ixa/2012/11/12/mintegia-kitxuaren-prozesamendurako-lehen-hurbilketa/feed/ 4
Ibilaldia 2012 omenaldia: Euskara teknologia berrietan sartzeko aintzindariak https://www.unibertsitatea.net/blogak/ixa/2012/06/07/ibilaldia-2012-omenaldia-ikt-eu/ https://www.unibertsitatea.net/blogak/ixa/2012/06/07/ibilaldia-2012-omenaldia-ikt-eu/#comments Thu, 07 Jun 2012 16:38:42 +0000 https://www.unibertsitatea.net/blogak/ixa/?p=429 Ixa taldeko Iñaki Alegria eta Kepa Sarasola omenduak izan dira aurtengo Ibilaldian teknologia berrietan euskara sartzeko egindako lanengatik.Hauek izan dira omenduak:

“Euskara Teknologia Berrietan”  bideo bat grabatu dute omendu guztien iritzi eta esperientziekin.
Hamaika telebistako bideo honetako lehenengo 6 minutuetan elkarrizketa batzuk ikus daitezke omenduekin.

DSC_0651Udako Euskal Unibertsitatean 1989an hasi zen lantzen informatika euskaraz. Hortik aurrera urtero antolatu ditu hitzaldiak, liburu eta material sorkuntza, ikastaroak, eta Informatikari Euskaldunen Bilkurak 1996tik. EHUko Informatika Fakultatean 1984-85 ikasturtean eman ziren lehen aldiz euskaraz bi ikasgai. UEUn eta Informatika Fakultatean jarraitu zioten materiala eta irakasleak prestatzeari eta 1998-99 ikasturtean lehenengo aldiz posible izan zen lizentziaturako ikasgai guztiak euskaraz egitea. Ixa taldeko hainbat kidek ere parte hartu zuten ibilbide horretan.
Ixa taldeak 1994tik 20 produktu baino gehiago sortu ditu (tresna, baliabide eta aplikazio linguistikoak) euskara teknologia berrietan errazago erabiltzeko.

Aurtengo Ibilaldiaren leloa ibipuntuzero i2.0 izan da. Horrela azaldu dute:

Gero eta gehiago gure ikasleak sare sozial ezberdinei buruz ari dira hizketan, ikastolako ordenagailuak ikas-irakaskuntza prozesuan ezinbesteko elementua dira egun, eta hori dela eta, guk ere internet zaleen artean hain hedatuta dagoen 2.0 horretan sartzeko beharra ikusi genuen, Ibilaldia ere 2.0 izan behar delakoan gaudelako. Hori dela eta, IBIPUNTUZERO, Ibilaldia delako,…

]]>
https://www.unibertsitatea.net/blogak/ixa/2012/06/07/ibilaldia-2012-omenaldia-ikt-eu/feed/ 2
Berbatek proiektua bukatu da arrakastarekin https://www.unibertsitatea.net/blogak/ixa/2012/02/08/berbatek-proiektua-bukatu-da-arrakastarekin/ https://www.unibertsitatea.net/blogak/ixa/2012/02/08/berbatek-proiektua-bukatu-da-arrakastarekin/#comments Wed, 08 Feb 2012 18:29:15 +0000 https://www.unibertsitatea.net/blogak/ixa/berbatek-proiektua-bukatu-da-arrkastarekin Atzo bukaera eman genion Berbatek proiektuari prentsaurreko batekin. Bertan izan ziren Eusko Jaurlaritzaren
ordezkari instituzionalak (Industria Saileko Edorta Larrauri eta HPSko Begoña Muruaga) eta proiektuan parte hartu duten erakundeen ordezkariak ere.
Demo hauek erakutsi ziren:

  • Bikoizketa automatikoa, gaztelaniazko azpitituluetatik abiatuta dokumentalak euskaratzeko. IXA Taldearen Matxin itzultzaile automatikoak itzultzen ditu azpitituluok euskarara.
  • Multimedia-bilatzaile semantiko eta eleaniztuna, web-ean zientzia- eta teknologia-edukiei buruzko bilaketak egiten dituena.
    IXA Taldeak eraikitako zientzia eta teknologiako WNTerm ontologia
    espezializatua du oinarri (zientzia eta teknologiaren alorreko
    kontzeptuak semantikoki erlazionatuta ageri diren sare bat,
    azpiklaseekin, sinonimoekin eta abar), eta laster aterako dugu bertsio osatuago bat.
  • Tutore pertsonala hizkuntza irakasteko. IXA taldearen teknologiaren bidez, automatikoki sortutako gramatika-ariketak
    (aditzak, deklinabidea…) edo ulermen-ariketak (testu batean hutsuneak
    betetzea, hainbat aukera emanda) proposatzen ditu, eta idazketarako laguntzak ematen ditu (aditzen jokabidea, zenbakien
    idazketa, hiztegi-kontsultak…), IXA eta Elhuyarren teknologiaren
    bidez.

Aurkezpenak medioetan harrera ona jaso du gaur:

Proiektukideok oso gustura gelditu gara bai lortutako elkarlanarekin,
bai demoekin eta emaitzekin. Demo horiez gain beste hainbat baliabide eta tresna
garatu ditugu proiektuan, horien berri Berbatek proiektuko webgunean aurkituko duzu.

]]>
https://www.unibertsitatea.net/blogak/ixa/2012/02/08/berbatek-proiektua-bukatu-da-arrakastarekin/feed/ 1
Maite Oronoz eta Larraitz Uria punta-puntan Mitxelena tesi-sarian https://www.unibertsitatea.net/blogak/ixa/2011/04/06/maite-oronoz-eta-larraitz-uria-punta-puntan-mitxelena-tesi-sarian/ https://www.unibertsitatea.net/blogak/ixa/2011/04/06/maite-oronoz-eta-larraitz-uria-punta-puntan-mitxelena-tesi-sarian/#comments Wed, 06 Apr 2011 09:17:21 +0000 https://www.unibertsitatea.net/blogak/ixa/maite-oronoz-ek-mitxelena-tesi-saria-jaso-du Astelehenean banatu ziren Euskarazko Tesien II. Koldo Mitxelena sariak Bilbon Euskaltzaindiaren egoitzan. Euskaltzaindiak berak eta EHUk antolatzen dute saria.

EHUko Ixa taldeko kidea den Maite Oronoz Antxordoki-k  irabazi du Ikasketa Teknikoen jakintza-arloko saria. Maitek bere doktore-tesian hainbat errore sintaktiko detektatzeko sistemak garatu ditu.
ZORIONAK Maiteri!
Zorionak zuzendariei! (Arantza Diaz de Ilarraza eta Koldo Gojenola)!

Tesi horren berri ikus dezakezu blog honetan lehengo urteko berri batean.

A! Eta bide batez, zorionak Larraitz Uria Garin lankideari ere bai. Bere tesia sari horretako bonboan azken unera arte egon baita.
Tesi bietan euskarazko erroreak eta desbideratzeak aztertzen dituzte, Maiterenean ikuspuntu informatikotik bideratuta, Larraitzenean linguistikotik.
ZORIONAK zuri ere bai, Larraitz!

]]>
https://www.unibertsitatea.net/blogak/ixa/2011/04/06/maite-oronoz-eta-larraitz-uria-punta-puntan-mitxelena-tesi-sarian/feed/ 1