Skip to content

Latest commit

 

History

History
45 lines (24 loc) · 3.36 KB

File metadata and controls

45 lines (24 loc) · 3.36 KB

Sistema bilingüe para resolver preguntas médicas: aportación de diferentes arquitecturas de modelos de lenguaje

Static Badge Static Badge Static Badge

El presente trabajo se centra en la implementación y entrenamiento de un modelo de lenguaje bilingüe de Inteligencia Artificial capaz de resolver preguntas de exámenes médicos Médico Interno Residente (MIR) con un número variable de respuestas posibles, utilizando técnicas del estado del arte del Procesamiento del Lenguaje Natural y el Aprendizaje Profundo.

Basándose en estudios previos en esta tarea, la experimentación de este trabajo cuenta con una sólida base de conocimiento para el entrenamiento de los modelos. A diferencia de previas investigaciones, los modelos generados en este trabajo reciben la información únicamente a través de los ejemplos de exámenes MIR sin consultar en fuentes de información externas.

Los modelos de lenguaje desarrollados en el presente trabajo son capaces de aprender las singularidades de las preguntas de los exámenes MIR. Para ello, se proponen diferentes arquitecturas de modelos que dan respuesta a preguntas de exámenes con un número variable de opciones posibles modificando las arquitecturas de investigaciones previas.

Haciendo uso de conjuntos de exámenes en español e inglés, los modelos generados en este proyecto presentan una capacidad bilingüe para responder estos exámenes. Esto contrasta con la mayoría de modelos desarrollados hasta la fecha en este tipo de tareas, que utilizan únicamente el inglés.

Arquitecturas

Se ha experimentado con dos arquitecturas de modelos de lenguaje, baseline y la arquitectura MedMCQA.

Aquitectura baseline:

arquitectura baseline

Aquitectura MedMCQA:

arquitectura MedMCQA

Datasets

Los dos datasets usados han sido:

Pre-trained model

El modelo pre-entrenado a usar es EriBERTa: A Bilingual Pre-Trained Language Model for Clinical Natural Language Processing . Disponible en HiTZ/EriBERTa-base.

Project structure

Los experimentos están listado en el directorio src. Cada uno tiene su propio directorio con su correspondiente archivo readme.

Otras dependencias

Static Badge Static Badge Static Badge Static Badge Static Badge Static Badge