Baliabideak & tresnak

Aurkezten dugun tresnak ondorengo ezaugarri berritzaileak ditu:

  • Doitasun eta estaldura altuak, %85 ingurukoak, gaixotasunetan edo sintometan, botiketan, gorputz ataletan eta modifikatzaileetan.
  • Eraginkortasuna, milaka hitz eta dokumentu denbora laburrean aztertzen ditu.
  • Sinpletasuna, ez du erabiltzen inolako hiztegirik. Sarrera bezala jatorrizko testua hartzen du eta emaitza bezala testu etiketatua bueltatzen du.

Tresna nazioarteko hainbat aldizkari eta konferentzia prestigiotsutan onartu diren ikerketa lanetan oinarritzen da:

  • Maite Oronoz, Koldo Gojenola, Alicia Pérez, Arantza Díaz de Ilarraza, Arantza Casillas (2015). On the creation of a clinical gold standard corpus in Spanish: Mining adverse drug reactions. Journal of Biomedical Informatics, Volume 56, August 2015, Pages 318–332, doi:10.1016/j.jbi.2015.06.016
  • Arantza Casillas, Arantza Díaz de Ilarraza, Koldo Gojenola, Luis Mendarte, Maite Oronoz, Javier Peral, Alicia Perez (2016). Deteami research-transference project: natural language processing technologies to the aid of pharmacy and pharmacosurveillance. Procesamiento del Lenguaje Natural, 57, 155-158.
  • Arantza Casillas, Arantza Diaz de Ilarraza, Kike Fernandez, Koldo Gojenola, Maite Oronoz, Alicia Pérez, Sara Santiso (2016). IXAmed-IE: on-line medical entity identification and ADR event extraction in Spanish. IEEE International Conference on Bioinformatics and Biomedicine (BIBM), Shenzhen, China, pages 846-849. Dec 15-18, 2016.
  • Arantza Casillas, Koldo Gojenola, Alicia Pérez, Maite Oronoz (2016). Clinical text mining for efficient extraction of drug-allergy reactions. IEEE International Conference on Bioinformatics and Biomedicine (BIBM), Shenzhen, China, Dec 15-18, 2016
  • Rebecka Weegar, Arantza Casillas, Arantza Diaz de Ilarraza, Maite Oronoz, Alicia Pérez, Koldo Gojenola (2016). The impact of simple feature engineering in multilingual medical NER. Proceedings of the Clinical Natural Language Processing Workshop (Coling), pages 1–6, Osaka, Japan, December 11-17 2016.
  • Alicia Pérez, Rebecka Weegar, Arantza Casillas, Koldo Gojenola, Maite Oronoz, Hercules Dalianis (2017). Semi-supervised medical entity recognition: A study on Spanish and Swedish clinical corpora. Journal of Biomedical Informatics, Volume 71, July 2017, Pages 16-30, ISSN 1532-0464.
  • S. Santiso, A. Casillas, A. Pérez, M. Oronoz (2017). Medical Entity Recognition and Negation Extraction: Assessment of NegEx on Health Records in Spanish. Bioinformatics and Biomedical Engineering. 5th International Work-Conference, IWBBIO 2017, Granada, Spain, April 26–28, 2017, Proceedings, Part I. DOI: 10.1007/978-3-319-56148-6 . Part of the Lecture Notes in Computer Science book series (LNCS, volume 10208).
  • Rebecka Weegar, Alicia Pérez, Hercules Dalianis, Koldo Gojenola, Arantza Casillas, Maite Oronoz (2018). Ensembles for clinical entity extraction. Revista: Procesamiento del Lenguaje Natural, Vol 60, p. 13-20, mar. 2018. ISSN 1989-7553.

Sistema honek gaztelaniaz idatzitako medikuntzako testu baten entitate medikoak ezagutuko ditu. 4 entitate-mota bereizten dira:

  • Botikak eta substantziak, adibidez Clamoxyl, penicilina, ...
  • Gaixotasunak eta sintomak, adibidez "infarto de miocardio", "cefalea", ...
  • Gorputz-atalak (gaixotasunekin lotuta): "pulmonar", "extremidades inferiores", ...
  • Kalifikatzaileak (gaixotasunekin lotuta): "severa", "leve", "tipo III", ...

Sistema algoritmo estatistiko batean oinarrituta dago, ospitaleko adituek markatutako testuetatik ikasten duelarik.

Tresna honek gazteleraz idatzitako dokumentu klinikoak aztertzen ditu. Emaitza bezala, testu tokenizatua, hitz bakoitzaren lema, kategoria eta entitate medikuen etiketa semantikoak bueltatzen ditu. Emaitza hori, xml hierarkiko formatuan bueltatzen du, zehazki Kyoto Annotation Format (Bosma et al., 2009) formatuan. Tresnak egiten duen analisia entitate medikuak harrapatzeko lagungarria dela frogatu da (Weegar et al., 2016). On-line atzitu daitekeen ondorengo tresna  FreeLing-Med tresnaren analisian oinarritzen da: hemen

Tresna honek gaztelaniaz idatzitako dokumentu klinikoak analizatzen ditu, emaitza hauek lortuz:

- Domeinu medikoko entitateen ezagutza, horien artean botikak (substantziak eta printzipio aktiboak barne) eta gaixotasunak

- Tresnak Botiken Aurkako Erreakzioak ere detektatzen ditu, botika batek gaixotasun bat sortzen duenean, adibidez:

Zure testu bat sartu nahi baduzu, sakatu hemen