Orri honetan: Aurkezpena / Deskargatu / Iturburu-kodea / Lizentzia / Nola egin aipamena / Instalazioa / Nola erabili / Kontaktua

ixa-pipe-dep-eu

ixa-pipe-dep-eu euskaraz idatzitako testuetarako dependentzia etiketatzailea da. Momentu honetan tresna honen bi bertsio eskaintzen ditugu. Lehen bertsioa (v1.0.0), sinpleagoa izateagatik azkarragoa dena, Mate analizatzailearen grafoetan oinarritutako bertsioan oinarritzen da. Bigarren bertsioa (v2.0.0) berriz, analizatzaile desberdinek sortzen dituzten analisien konbinazioan oinarritzen da. Hain zuzen ere, Mate eta MaltParser analizatzaileak erabiltzen ditu analisiak sortzeko, eta MaltBlender tresna hauen analisien konbinaziorik onenak aukeratzeko. Bi bertsioak Java programazio lengoaian inplementatuak daude.

Tresna honek NAF formatuan dagoen dokumentu bat hartzen du sarrera moduan. Sarrerako dokumentu horrek lemak, kategoriak eta informazio morfologikoa izan behar ditu. Sarreran beharreko informazio linguistiko hori duen NAF dokumentua ixa-pipe-pos-eu tresnaren irteeran lortzen da.

Deskargatu

Bertsio egonkor bakoitzari dagokion exekutagarria duen paketea ondorengo esteka hauetatik deskarga dezakezu:
    [v2.0.0] ixa-pipe-dep-eu-v2.0.0.tar.gz
    [v1.0.0] ixa-pipe-dep-eu-v1.0.0.tar.gz

Baliabide linguistikoak

Tresna honek beste hainbat tresna eta baliabide linguistiko behar ditu eta horiek ondorengo esteka hauetatik deskarga ditzakezu (bertsio bakoitzak bere baliabideak behar ditu):
    [v2.0.0] dep-eu-resources-v2.0.0.tgz
    [v1.0.0] dep-eu-resources-v1.0.0.tgz

Iturburu-kodea

Garapeneko azken bertsioaren iturburu-kodea Githubeko orri honetan aurkituko duzu.

Lizentzia

ixa-pipe-dep-eu-rako sortu den jatorrizko kode guztia GPL v3 lizentzia librera atxikiturik dago.

Software honek kanpoko hainbat tresna erabiltzen ditu, eta kode eta baliabideekin batera banatzen ditugu. Tresna hauek beren lizentzia eta copyright jabeak dituzte:

[v2.0.0]

[v1.0.0]

Aldi berean tresna hauek beste liburutegi batzuk erabiltzen dituzte. Ikus tresna horien NOTICE oharra.

Nola egin aipamena

ixa-pipe-dep-eu tresna erabiltzen baduzu, ondorengo lan hauetakoren baten aipamena (erabiltzen duzun bertsioaren arabera) egin zure lan akademikoan mesedez:

[v2.0.0]

Iakes Goenaga, Koldo Gojenola, Nerea Ezeiza. Combining Clustering Approaches for Semi-Supervised Parsing: the BASQUE TEAM system in the SPRML 2014 Shared Task. Workshop on Statistical Parsing of Morphologically Rich Languages SPRML 2014 Shared Task, Dublin, COLING Workshop. 2014
[bibtex]

[v1.0.0]

Arantxa Otegi, Nerea Ezeiza, Iakes Goenaga, Gorka Labaka. A Modular Chain of NLP Tools for Basque. In Proceedings of the 19th International Conference on Text, Speech and Dialogue - TSD 2016, Brno, Czech Republic, volume 9924 of Lecture Notes in Artificial Intelligence, pp. 93-100. 2016
[bibtex]

Instalazioa

Fitxategi exekutagarria duen paketea deskargatu ondoren, paketea deskonprimitu beharko duzu. Tresna erabiltzeko ez da inongo instalaziorik egin behar, baina urrats hauek jarraitu beharko dituzu beharrezkoak diren baliabideak erabilgarri jartzeko:

Honetaz gain, Java instalatua eduki beharko duzu zure makinan. Baita Perl ere MaltBlender erabili ahal izateko (v2.0.0-rako bakarrik).

Nola erabili

ixa-pipe-dep-eu-X.X.X.jar exekutagarria erabili behar da ixa-pipe-dep-eu tresna exekutatzeko. Honen derrigorrezko argumentu bakarra (-b) deskargatu atalean eskuragarri dagoen baliabideen direktorioaren kokapena da. ixa-pipe-dep-eu-X.X.X.jar komandoaren sintaxi osoa honakoa da:

> java -jar ixa-pipe-dep-eu-X.X.X.jar [-h] -b BALIABIDEAK_DIR [-c CONLL_FITX]

argumentuak:
   -h     mezu hau erakutsi eta irten
   -b BALIABIDEAK_DIR     [Beharrezkoa] Zehaztu deskargatutako baliabideen direktorioaren kokapena.
   -c CONLL_FITX     [Aukerazkoa] Irteera CONLL formatuan ere gorde nahi baduzu, zehaztu irteerako fitxategiaren kokapena.

run.sh script exekutagarria eskuragarri jarri da tresna exekutatu ahal izateko (script honek ixa-pipe-dep-eu-X.X.X.jar exekutagarriari deitzen dio goian azaldutako beharrezko argumentu guztiekin). Erabil dezakezu, baina exekutatu aurretik, eguneratu rootDir eta baliabideak aldagaiak instalazioa atalean adierazitako moduan.

Tresna honek sarrera estandarretik irakurtzen du, eta sarrera horrek UTF-8an kodetutako NAF formatuan dagoen dokumentua izan behar du, lemak, kategoriak eta informazio morfologikoa dituena (NAF-eko text eta terms elementuak). Sarreran beharreko informazio linguistiko hori duen NAF dokumentua ixa-pipe-pos-eu tresnaren irteeran lortzen dena da.

Hortaz, testu gordina duen fitxategi bateko dependentzia sintaktikoak lortzeko, honako komando hau erabil dezakezu (dena komando-lerro bakarrean):
> cat test.txt | sh ixa-pipe-pos-eu/ixa-pipe-pos-eu.sh | sh ixa-pipe-dep-eu/run.sh

Tresnak irteera estandarrean idatziko du, UTF-8an kodetutatako NAF formatuan. Irteerako NAF dokumentuan deps elementuen bidez dependentzia sintaktikoak markatuta ageriko dira beheko adibide honetan ikus daitekeen moduan (adibideko sarrerako esaldia honakoa da: "Donostiako Zinemaldiko sail ofizialean lehiatuko da Handia filma."):
<deps>
   <!--ncmod(Zinemaldiko, Donostiako)-->
   <dep from="t2" to="t1" rfunc="ncmod" />
   <!--ncsubj(da, Zinemaldiko)-->
   <dep from="t6" to="t2" rfunc="ncsubj" />
   <!--ncmod(lehiatuko, sail)-->
   <dep from="t5" to="t3" rfunc="ncmod" />
   <!--ncmod(sail, ofizialean)-->
   <dep from="t3" to="t4" rfunc="ncmod" />
   <!--xpred(da, lehiatuko)-->
   <dep from="t6" to="t5" rfunc="xpred" />
   <!--ncpred(da, Handia)-->
   <dep from="t6" to="t7" rfunc="ncpred" />
   <!--ncmod(da, filma)-->
   <dep from="t6" to="t8" rfunc="ncmod" />
   <!--PUNC(filma, .)-->
   <dep from="t8" to="t9" rfunc="PUNC" />
</deps>

Kontaktua

Arantxa Otegi, arantza.otegi@ehu.eus
Iakes Goenaga, iakes.goenaga@ehu.eus