Orri honetan: Aurkezpena / Deskargatu / Iturburu-kodea / Lizentzia / Nola egin aipamena / Plataforma eta betekizunak / Instalazioa / Nola erabili / Kontaktua
ixa-pipe-pos-eu
ixa-pipe-pos-eu analizatzaile morfosintaktiko eta etiketatzaile sendo eta estaldura zabalekoa da, Eustagger euskararako lematizatzaile/etiketatzailearen bertsio egokitua. C++ programazio lengoaian inplementatua dago.
Prozesamendu linguistikoko katearen lehenengo modulua da. Tresna honek testu gordina hartzen du sarrera moduan, eta irteeran token bakoitzarentzat lema, kategoria eta informazio morfologikoa idazten ditu NAF formatuan dagoen dokumentu batean.
Deskargatu
Azken bertsio egonkorrari dagokion aurrekonpilatutako pakete bitarra ondorengo esteka hauetatik deskarga dezakezu:Iturburu-kodea
Garapeneko azken bertsioaren iturburu-kodea Github Eustagger Lite orrian aurkituko duzu.
Lizentzia
ixa-pipe-pos-eu-rako sortu den jatorrizko kode guztia GPL v3 lizentzia librera atxikiturik dago.
Software honek kanpoko liburutegiak erabiltzen ditu, eta hauek beren lizentzia eta copyright jabeak dituzte:- PCRE++: Copyright (C) 2002-2003, Thomas Linden. GNU Lesser General Public License
- VISL CG-3: Copyright (C) 2007-2013, GrammarSoft ApS. GNU General Public License v3
- SWI Prolog: Copyright (C) 2008, University of Amsterdam. GNU General Public License v2
- Foma: Copyright (C) 2008-2012, Mans Hulden. GNU General Public License v2
- Freeling: Copyright (C) 2004, TALP Research Center, Universitat Politecnica de Catalunya. GNU General Public License v3
- Boost: Copyright (C) 2004-2006, Joe Coder. Boost Software License
Nola egin aipamena
ixa-pipe-pos-eu tresna erabiltzen baduzu, ondorengo lan honen aipamena egin zure lan akademikoan mesedez:
Arantxa Otegi, Nerea Ezeiza, Iakes Goenaga and Gorka
Labaka. A Modular Chain of NLP Tools for Basque.
In Proceedings of the 19th International Conference on
Text, Speech and Dialogue - TSD 2016, Brno, Czech Republic,
volume 9924 of Lecture Notes in Artificial Intelligence,
pp. 93-100. 2016
[bibtex]
Plataforma eta betekizunak
Erabiltzeko prest dauden paketeak Linuxerako bakarrik daude eskuragarri.
Beste makina batzuetan erabiltzeko, iturburu-kodea deskargatu eta konpila daiteke. Dependentzia batzuk dituenez, aurretik liburutegi eta programa gehigarri batzuk instalatu beharra daude. Horretarako, IRAKURRI fitxategiko argibideak jarraitu.
Instalazioa
Pakete bitar aurrekonpilatua deskargatu ondoren, fitxategia deskonprimitu eta exekutagarria erabiltzeko prest egongo da, inongo instalaziorik egin gabe.
Iturburu-kodea konpilatu nahi baduzu, jarraitu IRAKURRI fitxategiko argibideak.
Nola erabili
ixa-pipe-pos-eu.sh exekutagarria erabili behar da ixa-pipe-pos-eu tresna exekutatzeko. Ez dauka argumenturik.
Tresna honek sarrera estandarretik irakurtzen du, eta sarrera horrek UTF-8an kodetuta dagoen testu planoa izan behar du. Hortaz, testu gordina duen fitxategi bateko lemak, kategoriak eta informazio morfologikoa lortzeko, honako komando hau erabil dezakezu:<wf id="w1" offset="0" length="10" sent="1" para="1">Donostiako</wf>
<wf id="w2" offset="11" length="11" sent="1" para="1">Zinemaldiko</wf>
<wf id="w3" offset="23" length="4" sent="1" para="1">sail</wf>
<wf id="w4" offset="28" length="10" sent="1" para="1">ofizialean</wf>
<wf id="w5" offset="39" length="9" sent="1" para="1">lehiatuko</wf>
<wf id="w6" offset="49" length="2" sent="1" para="1">da</wf>
<wf id="w7" offset="52" length="6" sent="1" para="1">Handia</wf>
<wf id="w8" offset="59" length="5" sent="1" para="1">filma</wf>
<wf id="w9" offset="64" length="1" sent="1" para="1">.</wf>
</text>
<terms>
<!-- Donostiako -->
<term id="t1" lemma="Donostia" morphofeat="NL0LS000" pos="R" case="IZE LIB PLU- GEL NUMS MUGM ZERO HAS_MAI @<IZLG @IZLG>">
<span>
<target id="w1"/>
</span>
</term>
<!-- Zinemaldiko -->
<term id="t2" lemma="zinemaldi" morphofeat="NC0LS000" pos="N" case="IZE ARR GEL NUMS MUGM ZERO HAS_MAI @<IZLG @IZLG>">
<span>
<target id="w2"/>
</span>
</term>
<!-- sail -->
<term id="t3" lemma="sail" morphofeat="NC000000" pos="N" case="IZE ARR BIZ- ZERO @KM>">
<span>
<target id="w3"/>
</span>
</term>
...
</terms>
Kontaktua
Arantxa Otegi, arantza.otegi@ehu.eus
Nerea Ezeiza, n.ezeiza@ehu.eus