Recursos & herramientas

La herramienta que presentamos tiene los siguientes aspectos novedosos:

  • Alta precisión y cobertura, cercanos al 85%, para entidades médicas del tipo: enfermedad o síntoma, medicamento, parte del cuerpo (o localización) y modificadores (severa, leve, de tipo II, …).
  • Eficiencia, al permitir analizar miles de palabras y documentos en breve tiempo.
  • Simplicidad, al no requerir de ningún tipo de diccionario. Únicamente toma como entrada el texto original y obtiene como salida el texto anotado con entidades médicas.

La herramienta desarrollada está basada en numerosos trabajos de investigación que han sido presentados y aceptados en revistas y conferencias de prestigio internacional:

  • Maite Oronoz, Koldo Gojenola, Alicia Pérez, Arantza Díaz de Ilarraza, Arantza Casillas (2015). On the creation of a clinical gold standard corpus in Spanish: Mining adverse drug reactions. Journal of Biomedical Informatics, Volume 56, August 2015, Pages 318–332, doi:10.1016/j.jbi.2015.06.016
  • Arantza Casillas, Arantza Díaz de Ilarraza, Koldo Gojenola, Luis Mendarte, Maite Oronoz, Javier Peral, Alicia Perez (2016). Deteami research-transference project: natural language processing technologies to the aid of pharmacy and pharmacosurveillance. Procesamiento del Lenguaje Natural, 57, 155-158.
  • Arantza Casillas, Arantza Diaz de Ilarraza, Kike Fernandez, Koldo Gojenola, Maite Oronoz, Alicia Pérez, Sara Santiso (2016). IXAmed-IE: on-line medical entity identification and ADR event extraction in Spanish. IEEE International Conference on Bioinformatics and Biomedicine (BIBM), Shenzhen, China, pages 846-849. Dec 15-18, 2016.
  • Arantza Casillas, Koldo Gojenola, Alicia Pérez, Maite Oronoz (2016). Clinical text mining for efficient extraction of drug-allergy reactions. IEEE International Conference on Bioinformatics and Biomedicine (BIBM), Shenzhen, China, Dec 15-18, 2016
  • Rebecka Weegar, Arantza Casillas, Arantza Diaz de Ilarraza, Maite Oronoz, Alicia Pérez, Koldo Gojenola (2016). The impact of simple feature engineering in multilingual medical NER. Proceedings of the Clinical Natural Language Processing Workshop (Coling), pages 1–6, Osaka, Japan, December 11-17 2016.
  • Alicia Pérez, Rebecka Weegar, Arantza Casillas, Koldo Gojenola, Maite Oronoz, Hercules Dalianis (2017). Semi-supervised medical entity recognition: A study on Spanish and Swedish clinical corpora. Journal of Biomedical Informatics, Volume 71, July 2017, Pages 16-30, ISSN 1532-0464.
  • S. Santiso, A. Casillas, A. Pérez, M. Oronoz (2017). Medical Entity Recognition and Negation Extraction: Assessment of NegEx on Health Records in Spanish. Bioinformatics and Biomedical Engineering. 5th International Work-Conference, IWBBIO 2017, Granada, Spain, April 26–28, 2017, Proceedings, Part I. DOI: 10.1007/978-3-319-56148-6 . Part of the Lecture Notes in Computer Science book series (LNCS, volume 10208).
  • Rebecka Weegar, Alicia Pérez, Hercules Dalianis, Koldo Gojenola, Arantza Casillas, Maite Oronoz (2018). Ensembles for clinical entity extraction. Revista: Procesamiento del Lenguaje Natural, Vol 60, p. 13-20, mar. 2018. ISSN 1989-7553.

Este sistema reconoce las entidades del dominio médico que aparecen en un documento. Se distinguen 4 tipos de entidades correspondientes a:

  • Medicamentos y sustancias, por ejemplo Clamoxyl, penicilina, ...
  • Enfermedades y síntomas, como "infarto de miocardio", "cefalea", ...
  • Elementos anatómicos (asociados a enfermedades): "pulmonar", "extremidades inferiores", ...
  • Calificadores (asociados a enfermedades): "severa", "leve", "tipo III", ...

El sistema está basado en un algoritmo estadístico, que ha aprendido a partir de un amplio conjunto de textos médicos anotados por expertos hospitalarios.

Esta herramienta ha sido diseñada para analizar documentos clínicos escritos en español. Como resultado devuelve el texto tokenizado, el lema correspondiente, la categoría y también las etiquetas semánticas de las entidades médicas. El resultado que se obtiene está en un formato tipo xml hierárquico, Kyoto Annotation Format (Bosma et al., 2009). Se ha demostrado que el resultado de la herramienta ayuda a la hora de reconocer entidades médicas (Weegar et al., 2016). La siguiente herramienta on-line está basada en el análisis derivado de FreeLing-Med: aquí

Esta herramienta permite analizar documentos médicos y obtiene como resultados:

- Reconocimiento de entidades del dominio médico, como medicamentos (incluyendo nombre de medicamentos, sustancias y principios activos) y enfermedades

- Además, también reconoce relaciones adversas entre medicamentos, donde un medicamento, sustancia o principio activo produce una enfermedad, por ejemplo:

Para introducir tu propio texto, pulsa aquí