PROSA-MED

PROSA-MED: PROcesamiento Semántico textual Avanzado para la detección de diagnósticos, procedimientos, otros conceptos y sus relaciones en informes MEDicos.

El sector sanitario constituye un sector de vital importancia tanto por su papel en el estado del bienestar como por su carácter multidisciplinar. El número de documentos del dominio médico generados por los centros de atención al paciente (hospitales y atención primaria) aumenta constantemente y en el que el desarrollo de herramientas automáticas de análisis textual puede suponer un gran avance crucial para los sistemas de salud. Las Tecnologías de la Lengua disponen de herramientas para realizar el análisis textual que ayude al personal médico a aumentar su productividad redundando en el beneficio de todos. El consorcio de grupos de investigación de las Universidades e instituciones del ámbito sanitario que presentamos este proyecto está convencido de la factibilidad de realizar un importante salto tecnológico en este campo. Nuestro objetivo es proponer soluciones en el tratamiento de Informes Clínicos Hospitalarios e Historia Clínica Electrónica a procesos que en la actualidad suponen un gran coste personal y económico. Presentamos tres casos de uso: 1) codificación automática de informes médicos, 2) la detección de reacciones adversas a medicamentos y 3) detección de relaciones entre conceptos que permitan descubrir nuevo conocimiento médico. El tipo de relación identificada en el caso 2 será primordial para facilitar y mejorar la solución del caso 1 y ambos, a su vez, se utilizarán en el caso 3 para establecer patrones sobre el historial clínico de un paciente.

En este proyecto se desarrollarán un conjunto de procesadores que permitirán el análisis automático de textos médicos teniendo en cuenta criterios de robustez, alta precisión y cobertura. El proyecto pondrá a disposición del personal médico un conjunto amplio y versátil de herramientas, recursos lingüísticos, terminológicos, y semánticos que se aplicarán al tratamiento de los tipos de texto mencionados para las siguientes tareas:

- Análisis morfológico, sintáctico y semántico adaptado a textos médicos de acuerdo al estado del arte en el área y haciendo especial énfasis en el reconocimiento de entidades.

- Asignación de códigos diagnósticos a informes médicos según la CIE-10.

- Detección de relaciones entre conceptos como paso previo avanzar en el área de descubrir evidencias no explícitamente expresadas en los textos.

El proyecto hará uso de técnicas supervisadas y no supervisadas. Además, es importante indicar que se desarrollarán herramientas para distintas lenguas. El español constituye un objetivo ambicioso, dado su amplio uso en los sistemas de salud de multitud de países. Además, se explorarán lenguas con diferentes características y grados de desarrollo en el ámbito médico: catalán y vasco. El trabajo desarrollado en este proyecto tiene un gran interés en el entorno empresarial público y privado, ya que se proporcionará software que estará disponible para PYMES u otras empresas que tengan interés en desarrollar productos en el dominio médico. Las entidades participantes representan a tres sistemas de salud públicos (Cataluña, Madrid y País Vasco) pero podrá aplicarse a otros ámbitos y áreas de aplicación. Además, dada la experiencia de los grupos de investigación participantes, se espera que este proyecto genere también un importante impacto científico en forma de publicaciones, generando nuevo conocimiento que supondrá un avance en distintas áreas científicas.