bilaketa – Hizkuntza-teknologiak, Ixa Taldearen bloga https://www.unibertsitatea.net/blogak/ixa IXA taldea. Hizkuntzaren prozesamendua Wed, 31 May 2023 21:32:01 +0000 eu hourly 1 https://wordpress.org/?v=4.9.23 https://www.unibertsitatea.net/blogak/ixa/files/2018/10/ixa.jpg bilaketa – Hizkuntza-teknologiak, Ixa Taldearen bloga https://www.unibertsitatea.net/blogak/ixa 32 32 Robot-bertsolariaren lehen plaza https://www.unibertsitatea.net/blogak/ixa/2012/04/20/robot-bertsolariaren-lehen-plaza/ https://www.unibertsitatea.net/blogak/ixa/2012/04/20/robot-bertsolariaren-lehen-plaza/#comments Fri, 20 Apr 2012 13:37:33 +0000 https://www.unibertsitatea.net/blogak/ixa/robot-bertsolariaren-lehen-plaza
(Argazkia: Berria / Jon Orbe / Argazki Press)

Apirilaren 18an egin zuten Galtxagorri eta Tartalo robotek euren lehen plaza, EHU-ko Gipuzkoako Campuseko gelategiko portxetan. Andoni Egaña, Felix Zubia, Maialen Velarde eta Oier Lakuntza bertsolariak lagun hartuta, ordu erdi pasatxoko bertso-saioa egin zuten.

Euren lehen plaza izanik, egin zituzten akatsak robotek (ez urduritasunak eraginda, jakina!), baina sortutako ikusminari ere ondo baino hobeto erantzun zioten.

Hiru ikerkuntza talderen arteko elkarlanetik sortu da robot-bertsolaria:

  • Batetik, robotika-lanak daude, Robotika eta Sistema Autonomoen taldeak gorputza jarri dio makina bertsolariari. Honela, robota gai da aginduak jaso eta  bere ingurunean mugitzeko: mikrofonora hurbildu, heldu, jiratu, atzera itzuli eta antzeko mugimenduak eginez. Aurrera begirako helburua, gizaki eta roboten arteko elkarrekintza garatzea litzateke: komunikazioa hizkuntza naturalean gauzatuz, sentsoreak erabiliz ustekabeko gertaeren aurrean erantzuteko, eta bertsoaren komunikazio ekintzan eragina duen gorputz espresioan arreta handiagoa jarriz, besteak beste.
  • Bestetik, Aholab ikerkuntza taldearen lana dago. Talde honek ahotsaren sorkuntzan hainbat urtetan egindako lanari esker jarri ahal izan dugu kantari robota. Horretarako, lehenik eta behin, abestu behar duen bertsoa eta haren egitura musikala azaldu behar zaizkio ordenagailuari, hala nola, silaba  bakoitzaren nota eta
    hauen iraupena. Bertsoaren testua pasatzen zaio Aholab-en garatutako
    ahoTTS programari, eta silaba bakoitzaren iraupena finkatzen da, silabak luzatu behar direnean fonema batzuk (bokalak) gehiago luzatuz eta beste batzuk (kontsonanteak) gutxiago. Ondoren, estatistikoki ezarri zaion pitch kurba (hitz egiterakoan erabiltzen ditugun musika-nota arruntak) aldatuko da, erabili nahi den doinuaren frekuentziak finkatuz. Hau egindakoan, nota berriak ezartzen zaizkio berbaldiari, Aholab ikerkuntza taldean garatutako Ahocoder programa erabilita.
  • Azkenik, IXA ikerkuntza taldean egindako lanari esker, hutsetik bertsoak sortzeko gai da robota (hala-moduzkoak badira ere), ikasketa automatikoko teknikak baliatuz. Etorkizunean hau hobetzeko lanean ari da IXA taldea. Era berean, zentzu handiagoko bertsoak sortzeko, beste bide batzuk jorratu dira: eskuragarri zeuden bertso multzo bat harturik abiapuntu gisa, hainbat bertsoalditako errima
    bereko puntuak uztartzen ditu ordenagailuak bertsoa osatzeko; gainera, puntu bakoitzean, zenbait hitz ordezkatu egiten ditu, jatorrizko hitzaren sinonimoak, antonimoak edo semantikoki nolabait erlazionatutako hitzak baliatuz. Ordezkapen hau egiteko, EuskalWordNet datu-basea darabil:
    euskararako sortutako ezagutza-base lexikal eleanitza, hau da, euskarazko hitzen zuhaitz semantiko moduko bat.

Hiru ikerkuntza talde hauek eskainitako baliabideak oinarri gisa hartuta, Manex Agirrezabal izan da proiektu honen garatzaile nagusia, Aitzol Astigarraren laguntzarekin.

Hona hemen, roboten lehen bertso-saioak sortutako ikusminaren hainbat adibide:

]]>
https://www.unibertsitatea.net/blogak/ixa/2012/04/20/robot-bertsolariaren-lehen-plaza/feed/ 2
Bilaketaz haruntzago: ezagutza biomedikoa lortzen hizkuntzaren prozesaketaren bidez (Karin Verspoor, 2011/03/18) https://www.unibertsitatea.net/blogak/ixa/2011/03/17/bilaketaz-haruntzago-ezagutza-biomedikoa-lortzen-hizkuntzaren-prozesaketaren-bidez-karin-verspoor-20110318/ https://www.unibertsitatea.net/blogak/ixa/2011/03/17/bilaketaz-haruntzago-ezagutza-biomedikoa-lortzen-hizkuntzaren-prozesaketaren-bidez-karin-verspoor-20110318/#comments Thu, 17 Mar 2011 19:58:14 +0000 https://www.unibertsitatea.net/blogak/ixa/bilaketaz-haruntzago-ezagutza-biomedikoa-lortzen-hizkuntzaren-prozesaketaren-bidez-karin-verspoor-2011-03-18
Gaia:
“Beyond Search: enabling biomedical knowledge discovery through natural language processing”
“Bilaketaz haruntzago: ezagutza biomedikoa lortzen hizkuntzaren prozesaketaren bidez”
Hizlaria
:
Karin Verspoor Research Assistant
Professor Professor Larry Hunter‘s research lab,
Center for Computational Pharmacology
,
University of Colorado Denver
Tokia
: Informatika Fakultateko 3.1 mintegia
Eguna
: Martxoaren 18a (2011/03/18)
Ordua: 15:30

]]>
https://www.unibertsitatea.net/blogak/ixa/2011/03/17/bilaketaz-haruntzago-ezagutza-biomedikoa-lortzen-hizkuntzaren-prozesaketaren-bidez-karin-verspoor-20110318/feed/ 2
Hizkuntza Teknologia Interneteko bilatzaileetan: Azkenean sartu dute! https://www.unibertsitatea.net/blogak/ixa/2008/07/10/hizkuntza-teknologia-interneteko-bilatzaileetan-azkenean-sartu-dute/ https://www.unibertsitatea.net/blogak/ixa/2008/07/10/hizkuntza-teknologia-interneteko-bilatzaileetan-azkenean-sartu-dute/#comments Thu, 10 Jul 2008 12:06:55 +0000 https://www.unibertsitatea.net/blogak/ixa/hizkuntza-teknologia-interneteko-bilatzaileetan-azkenean-sartu-dute Azkenean bai! Interneteko bilatzaileetan nabaritzen ari da hizkuntza-teknologia erabiltzen hasi dela. Oraintsu arte Google-k eta beste bilatzaileetan hitz soila izan da oinarria, karaktere-sekuentzia hutsa. Azken hilabeteetan hasi dira azaltzen gauza berriak.
Google galderei erantzuten

Sei puntu aipa ditzakegu nazioartekoan:

Elebila ere multzo honetan sar dezakegu, hitzetatik harantzago baitoa bere bilaketetan euskarazko guneetan.
Ez da egin aurkezpen ofizialik tresna berri horiekin, apurka-apurka eta ixilik ari dira azaltzen, baina hor daude.
Azken asteetan, baina,  gaia pil-pilean egon da Microsoft-ek Powerset (sarearen analisi sintaktikoa egiten ari zen bilatzailea) erosi omen duelako.

Berri onak dira Hizkuntza-teknologiaren alde apustua egin dugunontzat.

]]>
https://www.unibertsitatea.net/blogak/ixa/2008/07/10/hizkuntza-teknologia-interneteko-bilatzaileetan-azkenean-sartu-dute/feed/ 3