Konbitzul datu-baseak euskarazko eta gaztelaniazko aditza+izena motako Unitate Fraseologikoak (UFak) biltzen ditu, haien ordainekin eta beste datu linguistiko batzuekin batera. Une honetan, datu-baseak gaztelaniazko 1.927 UF eta euskarazko 2.074 dauzka jasota, euskarazko 4.043 eta gaztelaniazko 3.022 ordainekin batera. Horietatik, gaztelaniazko 894 UFk eta haien ordain banak patroi morfosintaktikoa ere badute zehaztuta, zeina aplikagarria baita hizkuntza-tresna aurreratuetarako.
Kontsulta-tresna erabiltzeko oharrak
Bilaketak hainbat irizpideren eta iragazkiren arabera egin daitezke:
- Hizkuntza-noranzkoa: gaztelaniatik euskarara ala euskaratik gaztelaniara
- Bilatu nahi den gakoaren forma: hitz-konbinazio osoa, aditza edo izena
- Osaera morfologikoa: gaztelania-euskara zentzuan, gaztelaniazko konbinazioaren egitura; euskara-gaztelania zentzuan, euskarazko izenaren kasu- edo postposizio-marka
Hitz-konbinazio osoaren araberako bilaketa egin nahi bada, forma osoa idatzi beharra dago; esate baterako, caérsele el pelo idatzita, UF hori eta hiru ordain erakusten dira, baina, caer pelo bakarrik idatziz gero, ez da emaitzarik aurkitzen. Izena edo aditza bilatu nahi bada, berriz, lema da idatzi beharrekoa, hau da, caer edo pelo, eta ez caérsele, pelos eta halakorik.
Nolanahi ere, bada hirugarren aukera bat, tartekoa-edo: % ikurra erabiltzea. Ikur hori jartzerakoan, ikurraren lekuan edozein karaktere-segida onartzen da, eta, hala, esate baterako, pel% idatzi eta izena bilatzen ari garela zehazten badugu, pel- letrez hasten diren izenak barne hartzen dituzten UFak erakusten dira: poner en peligro, hacer pellas, jugarse el pellejo eta beste batzuk.
Baliabide honi erreferentzia egiteko:
- Iñurrieta U., Aduriz I., Díaz de Ilarraza A., Labaka G., Sarasola K. (2018). Konbitzul: an MWE-specific database for Spanish-Basque. Proceedings of the 11th Language Resources and Evaluation Conference (LREC2018), 2500-2504. orr. Miyazaki, Japonia.
abs: absolutiboa (etxea)
ala: adlatiboa (etxera)
dat: datiboa (etxeari)
erg: ergatiboa (etxeak)
gel: lekuzko genitiboa (etxeko)
gen: genitiboa (etxearen)
ine: inesiboa (etxean)
ins: instrumentala (etxeaz)
par: partitiboa (etxerik)
pro: prolatiboa (etxetzat)
soz: soziatiboa (etxearekin)
adi + ize: aditza + izena
adi + prep + det + ize: aditza + preposizioa + determinatzailea + izena
adi + prep + ize: aditza + preposizioa + izena
PREP-CC: preposizio-sintagma osagarria
SUBJ: subjektua
ATT: atributua
*: automatikoki erauzitako eta aztertutako konbinazioa/ordaina
Datu-base hau IXA ikerketa-taldeko Uxoa Iñurrietak doktoretza-tesirako egin duen lanaren emaitza da. Ikerketa-lan horren zati handi bat Ekonomia eta Lehiakortasun Ministerioaren doktoretza aurreko diru-laguntza bati esker egin dugu (BES-2013-066372), SKATeR proiektuaren barruan (TIN2012-38584-C06-02).
Parte-hartzaileak: Uxoa Iñurrieta, Itziar Aduriz, Arantza Díaz de Ilarraza, Gorka Labaka eta Kepa Sarasola; Mikel Artetxe (interfazearen egilea).
Harremanetarako: usoa.inurrieta[abildua|at]ehu.es.