Orri honetan: Aurkezpena / Deskargatu / Iturburu-kodea / Lizentzia / Nola egin aipamena / Instalazioa / Nola erabili / Kontaktua
ixa-pipe-dep-eu
ixa-pipe-dep-eu euskaraz idatzitako testuetarako dependentzia etiketatzailea da. Momentu honetan tresna honen bi bertsio eskaintzen ditugu. Lehen bertsioa (v1.0.0), sinpleagoa izateagatik azkarragoa dena, Mate analizatzailearen grafoetan oinarritutako bertsioan oinarritzen da. Bigarren bertsioa (v2.0.0) berriz, analizatzaile desberdinek sortzen dituzten analisien konbinazioan oinarritzen da. Hain zuzen ere, Mate eta MaltParser analizatzaileak erabiltzen ditu analisiak sortzeko, eta MaltBlender tresna hauen analisien konbinaziorik onenak aukeratzeko. Bi bertsioak Java programazio lengoaian inplementatuak daude.
Tresna honek NAF formatuan dagoen dokumentu bat hartzen du sarrera moduan. Sarrerako dokumentu horrek lemak, kategoriak eta informazio morfologikoa izan behar ditu. Sarreran beharreko informazio linguistiko hori duen NAF dokumentua ixa-pipe-pos-eu tresnaren irteeran lortzen da.
Deskargatu
Bertsio egonkor bakoitzari dagokion exekutagarria duen paketea
ondorengo esteka hauetatik deskarga dezakezu:
[v2.0.0] ixa-pipe-dep-eu-v2.0.0.tar.gz
[v1.0.0] ixa-pipe-dep-eu-v1.0.0.tar.gz
Baliabide linguistikoak
Tresna honek beste hainbat tresna eta baliabide linguistiko
behar ditu eta horiek ondorengo esteka hauetatik deskarga
ditzakezu (bertsio bakoitzak bere baliabideak behar
ditu):
[v2.0.0] dep-eu-resources-v2.0.0.tgz
[v1.0.0] dep-eu-resources-v1.0.0.tgz
Iturburu-kodea
Garapeneko azken bertsioaren iturburu-kodea Githubeko orri honetan aurkituko duzu.
Lizentzia
ixa-pipe-dep-eu-rako sortu den jatorrizko kode guztia GPL v3 lizentzia librera atxikiturik dago.
Software honek kanpoko hainbat tresna erabiltzen ditu, eta kode eta baliabideekin batera banatzen ditugu. Tresna hauek beren lizentzia eta copyright jabeak dituzte:
[v2.0.0]- mate-tools anna: GNU General Public License v2
- MaltParser: Copyright (C) 2007-2017, Johan Hall, Jens Nilsson and Joakin Nivre. Redistribution and use in source and binary forms, with or without modification, are permitted.
Aldi berean tresna hauek beste liburutegi batzuk erabiltzen dituzte. Ikus tresna horien NOTICE oharra.
Nola egin aipamena
ixa-pipe-dep-eu tresna erabiltzen baduzu, ondorengo lan hauetakoren baten aipamena (erabiltzen duzun bertsioaren arabera) egin zure lan akademikoan mesedez:
[v2.0.0]Iakes Goenaga, Koldo Gojenola, Nerea Ezeiza. Combining Clustering Approaches for Semi-Supervised Parsing: the BASQUE TEAM system in the SPRML 2014 Shared Task. Workshop on Statistical Parsing of Morphologically Rich Languages SPRML 2014 Shared Task, Dublin, COLING Workshop. 2014
[bibtex]
Arantxa Otegi, Nerea Ezeiza, Iakes Goenaga, Gorka
Labaka. A Modular Chain of NLP Tools for Basque.
In Proceedings of the 19th International Conference on
Text, Speech and Dialogue - TSD 2016, Brno, Czech Republic,
volume 9924 of Lecture Notes in Artificial Intelligence,
pp. 93-100. 2016
[bibtex]
Instalazioa
Fitxategi exekutagarria duen paketea deskargatu ondoren, paketea deskonprimitu beharko duzu. Tresna erabiltzeko ez da inongo instalaziorik egin behar, baina urrats hauek jarraitu beharko dituzu beharrezkoak diren baliabideak erabilgarri jartzeko:
- Deskargatu behar duzun baliabideen paketea hemendik:
[v2.0.0] dep-eu-resources-v2.0.0.tgz
[v1.0.0] dep-eu-resources-v1.0.0.tgz - Deskonprimitu pakete hori eta eguneratu run.sh fitxategi exekutagarria baliabideak aldagaiean adieraziz lortu berri duzun dep-eu-resources direktorioaren kokapena.
Honetaz gain, Java instalatua eduki beharko duzu zure makinan. Baita Perl ere MaltBlender erabili ahal izateko (v2.0.0-rako bakarrik).
Nola erabili
ixa-pipe-dep-eu-X.X.X.jar exekutagarria erabili behar da ixa-pipe-dep-eu tresna exekutatzeko. Honen derrigorrezko argumentu bakarra (-b) deskargatu atalean eskuragarri dagoen baliabideen direktorioaren kokapena da. ixa-pipe-dep-eu-X.X.X.jar komandoaren sintaxi osoa honakoa da:
argumentuak:
-h mezu hau erakutsi eta irten
-b BALIABIDEAK_DIR [Beharrezkoa] Zehaztu deskargatutako baliabideen direktorioaren kokapena.
-c CONLL_FITX [Aukerazkoa] Irteera CONLL formatuan ere gorde nahi baduzu, zehaztu irteerako fitxategiaren kokapena.
run.sh script exekutagarria eskuragarri jarri da tresna exekutatu ahal izateko (script honek ixa-pipe-dep-eu-X.X.X.jar exekutagarriari deitzen dio goian azaldutako beharrezko argumentu guztiekin). Erabil dezakezu, baina exekutatu aurretik, eguneratu rootDir eta baliabideak aldagaiak instalazioa atalean adierazitako moduan.
Tresna honek sarrera estandarretik irakurtzen du, eta sarrera horrek UTF-8an kodetutako NAF formatuan dagoen dokumentua izan behar du, lemak, kategoriak eta informazio morfologikoa dituena (NAF-eko text eta terms elementuak). Sarreran beharreko informazio linguistiko hori duen NAF dokumentua ixa-pipe-pos-eu tresnaren irteeran lortzen dena da.
Hortaz, testu gordina duen fitxategi bateko dependentzia sintaktikoak lortzeko, honako komando hau erabil dezakezu (dena komando-lerro bakarrean):<!--ncmod(Zinemaldiko, Donostiako)-->
<dep from="t2" to="t1" rfunc="ncmod" />
<!--ncsubj(da, Zinemaldiko)-->
<dep from="t6" to="t2" rfunc="ncsubj" />
<!--ncmod(lehiatuko, sail)-->
<dep from="t5" to="t3" rfunc="ncmod" />
<!--ncmod(sail, ofizialean)-->
<dep from="t3" to="t4" rfunc="ncmod" />
<!--xpred(da, lehiatuko)-->
<dep from="t6" to="t5" rfunc="xpred" />
<!--ncpred(da, Handia)-->
<dep from="t6" to="t7" rfunc="ncpred" />
<!--ncmod(da, filma)-->
<dep from="t6" to="t8" rfunc="ncmod" />
<!--PUNC(filma, .)-->
<dep from="t8" to="t9" rfunc="PUNC" />
</deps>
Kontaktua
Arantxa Otegi, arantza.otegi@ehu.eus Iakes Goenaga, iakes.goenaga@ehu.eus