Eustagger
Eustagger analizatzaile morfosintaktiko sendo eta estaldura zabalekoa da. Analizatzailea bi mailatako formalismoan oinarritzen da eta modu inkrementalean diseinatua izan da, hiru modulu nagusirekin: analizatzaile estandarra, aldaera linguistikoen analizatzailea, eta lexiko gabeko analizatzailea, hitz-formak hauteman ditzakeena lexikoan izan gabe. Transduktore lexikoak erabiliz gure analizatzailearen sistemaren osagai ezberdinen errendimendua eta deskripzioa bera hobetu ditugu. Lema posibleak, PoS eta bestelako informazio morfologikoa ere eskaintzen du. Era berean, data/denbora adierazpenak eta zenbakiak ezagutzen ditu. Desanbiguazioan erabili ditugun metodoak, Murriztapen Gramatika (MG) formalismoa eta HMMan oinarritutako analizatzailea dira. MGko erregelak ezaugarri morfologiko guztiak kontuan hartuz sortu dira eta prozesu honek testuen anbiguotasun morfologikoa gutxitzen du. Azkenik, tresna estokastikoa erabiltzen dugu ematen dituen etiketa-aukeretatik bat hautatzeko. Metodo estokastikoa bakarrik erabiliz, errore-tasa % 14 ingurukoa da, baina lexikoa hitz ezezagunekin aberastuz doitasuna % 2 inguru handitu daiteke. Bi metodoak konbinatzen direnean, prozesu osoaren errore-tasa % 3,5 da.
Tools and services
![]() ![]() Averell is a Python library and command line interface to download and to standardize corpora from ten multi-lingual poetry repositories |
![]() ![]() Jollyjumper is our enjambment detection Python library for Spanish |
![]() ![]() Rantanplan is a Python library for the automated scansion of Spanish poetry |
![]() ![]() PoetryLab: An Open Source Toolkit for the Analysis of Spanish Poetry Corpora |
![]() ![]() Tool for documenting and analyzing speakers' judgments about spatial and sociocultural linguistic variation. |
![]() ![]() FOLERPA is an online tool for carrying out perceptual experiments. |
![]() ![]() Research tool for the study of the geographical distribution of surnames in Galicia. |
![]() ![]() This web service calculates different lexicometric measures and displays them graphically (tokens, types, hapaxes & type/token ratio). |
![]() ![]() Pedersen's Ngram Statistics Package |
![]() ![]() This is the UPF Freeling-based part-of-speech tagger. |
![]() ![]() This WS performs dependency parsing using Bohnet's graph-based Parser. The input is text in plain text or CoNLL format. The languages supported are English and Spanish. |
![]() ![]() Freeling-based Named Entity Recognition - NER |
![]() ![]() Word-Sense Disambiguation |
![]() ![]() Multilingual NLP tools |
![]() ![]() A modular chain of Natural Language Processing tools for Basque |
![]() ![]() Statistical Syntactic analyzer for Basque |
![]() ![]() Morphosyntactic tagger for Basque |
![]() ![]() Spelling and grammar checker for Basque |
![]() ![]() A web application to analyse syntactic variation of Basque dialects |
![]() ![]() Category analyzer |