Natural Language Processing for MEDical TERMinology

(Procesamiento del lenguaje natural para terminología médica)

Proyecto financiado por InterTalentum UAM, Marie Skłodowska-Curie COFUND, (2019-2021) en la Universidad Autónoma de Madrid

Objetivos

El proyecto NLPMedTerm tiene como objetivo aportar a la comunidad investigadora recursos para el procesamiento del lenguaje natural (PLN) en el dominio médico en español.

Paquete de trabajo 1: se ha recogido un lexicón de términos médicos en español, enriquecido con identificadores únicos de concepto (Concept Unique Identifiers, CUIs), tipos semánticos (Semantic Types) y grupos semánticos (Semantic Groups) extraídos del Unified Medical Language System© (UMLS©). → Entregable 1 star
Se incluye información lingüística de los términos y la categoría morfológica (Part-of-Speech). Se considera la variación morfológica y derivacional de los términos (p. ej., abdomen / abdominal), y la equivalencia entre raíces y afijos sinónimos (p. ej., cardio- / cardiaco-).

Paquete de trabajo 2: se ha anotado un corpus de textos médicos con entidades médicas, como recurso experimental. El corpus se utilizará para entrenar modelos de aprendizaje automático (machine-learning) que incorporen enfoques de última generación basados en redes neuronales. Los textos se distribuyen con fines académicos y de investigación. → Entregable 2 star
En este paquete de trabajo, también se han obtenido word embeddings de dominio médico → Entregable 3 star

Colaboradores del paquete de trabajo 2:

El proyecto favorece la continuidad en futuros proyectos para la mejora del indexado de repositorios de artículos biomédicos, o el desarrollo de lexicográficos que consideren diferentes variedades de español.


Entregables


Contacto

Leonardo Campillos Llanos, investigador postdoctoral.

Laboratorio de Lingüística Informática, Universidad Autónoma de Madrid

name.surname AT uam.es
name.surname AT gmail.com


Colaboraciones


Publicaciones

Última actualización: julio del 2020.