EU | EN | ES |

ANALHITZA te ayudará a extraer de un texto en euskara, español o inglés la siguiente información lingüística:
- nombres, adjetivos, verbos, adverbios...
- nombres de personas, nombres de lugares...
- secuencias de dos, tres y cuatro palabras
- ... y mucho más!
El texto a analizar puede ser el que tengas en un fichero, algo que copiarás aquí, o de una página web, pero tendrá que estar codificado en UTF8. Para utilizar ANALHITZA, introduce el texto a analizar siguiendo una de las 3 opciones de aquí abajo, y a continuación, elige el idioma del texto (euskara, español o inglés). Después de esperar un momento, recibirás los resultados en un fichero Excel. Así, podrás adaptar fácilmente los resultados a tus necesidades.
ANALHITZA procesa automáticamente el texto utilizando ixaKat (para el euskara) e Ixa pipes (para el español e inglés), que son cadenas modulares de procesadores lingüísticos.
ANALHITZA, haciendo uso de las tecnologías del lenguaje, ha sido diseñado para que los investigadores de las humanidades y ciencias sociales puedan obtener análisis lingüísticos fiables y fácilmente manipulables. Si tienes definido un tema de investigación en alguno de estos campos, si dispones de un corpus y si estás interesado en utilizar ANALHITZA, escríbenos y te podremos asesorar: mikel.iruskieta@ehu.eus
Si utilizas ANALHITZA, cita el siguiente artículo en tu trabajo académico por favor:
Otegi, A. Imaz, O. Díaz de Ilarraza, A. Iruskieta, M. Uria, L. 2017 ANALHITZA: a tool to extract linguistic information from large corpora in Humanities research. Procesamiento del Lenguaje Natural 58: 77-84.