Terapias Naturales

Recetas con Medicina Ortomolecular de Precisión

Aprendizaje de máquina para el diagnóstico de pacientes con diabetes tipo II

Deja un comentario

El siguiente contenido ha sido publicado en calidad de apoyo adicional al curso de «Informática Biomédica para el Descubrimiento de Terapias Inteligentes y el Diagnóstico de Enfermedades», para que los participantes que lo están tomando comprendan mejor el concepto de aprendizaje de máquina supervisado. Si no estás tomando el curso y te interesa el tema, te recomiendo cursar el primer módulo del taller.

Archivo de datos clínicos

La imagen adjunta muestra los primeros 24 registros de un total de 768 ejemplos de pacientes (pulse sobre la misma para agrandarla). Cada registro contiene 8 atributos que están determinando el estado de salud de una población de mujeres indígenas Pima, en los estados de Sonora y Chihuahua. Los valores de los atributos de entrada que determinan si la paciente es diabética o no, empiezan en la columna B (preg) y terminan en la columna I (age). La variable de salida (class) corresponde a la columna J y es la que usamos para clasificar a cada paciente como diabética (class=1), o como saludable (class=0).

Descripción de variables predictoras

A continuación se da una descripción de los atributos de entrada que determinarán si una paciente es diabética o no:

preg: número de veces que la paciente se ha embarazado (columna B).
plas: concentración de glucosa en plasma a 2 horas, en una prueba oral de tolerancia a la glucosa (C).
pres: Presión arterial diastólica (mm de Hg), D.
skin: grosor del tríceps cutáneo (mm), E.
insu: 2 horas de insulina en suero (mu U/ml), F.
mass: índice de masa corporal (peso en kg/estatura al cuadrado), G.
pedi: función pedigree de la diabetes (H).
age: edad (en años), I.

Así por ejemplo, la paciente con los datos del registro No. 17, que no se ha embarazado nunca (preg=0), con una glucosa en sangre registrada de 118, una presión arterial de 84 mm Hg, un grosor de tríceps de 47 mm, con una insulina en suero de 230 mu U/ml, un índice de masa corporal de 45.8 Kg/m2, 0.551 de función pedigree y de 31 años de edad, se diagnosticó como diabética (class=1).

Diagnóstico por medio de aprendizaje supervisado

Para diagnosticar a una nueva paciente, procederíamos a abrir el archivo recién descrito con el programa WEKA, a fin de que la máquina aprenda en qué circunstancias una paciente desarrolla diabetes. Una vez abierto el archivo, el programa muestra una gráfica que revela la proporción de pacientes que han dado positivo a la diabetes (en rojo) y las que no lo han hecho (azul), en función del número de embarazos que ha tenido cada una. El histograma de la imagen a su derecha revela que las mujeres indígenas Pima que han tenido menos de 6 embarazos, son menos propensas a la diabetes tipo II. Inferencias similares pueden hallarse al seleccionar otros atributos (pulse sobre la imagen para agrandarla).

Selección del modelo óptimo

Pero lo que más nos interesa de esta herramienta es la precisión de sus diagnósticos. Al ejecutar un análisis de los datos con tres algoritmos diferentes, los resultados de la clasificación se muestran en la tabla adjunta. De acuerdo con nuestra experiencia, las técnicas que se utilizaron en WEKA alcanzaron precisiones del orden de 75.13%, 73.828% y 76.302% para MLP, J48 y Naive Bayes, respectivamente. Observamos que el modelo que aplica el algoritmo de Naive Bayes se desempeñó mejor, pues entregó resultados más precisos en menos tiempo. Estos tres clasificadores se utilizan en varios campos de la minería de datos, en la ingeniería biomédica y como acabamos de ver, en el diagnóstico médico.

Áreas de aplicación del aprendizaje de máquina

demo 1 del módulo 1 de IBHay métodos de clasificación que emplean máquinas vectoriales de soporte (SVM) con detección automática de picos en los electroencefalogramas (EEG) para diagnosticar problemas neurológicos relacionados con la epilepsia. Hay quienes están usando redes neuronales artificiales para clasificar señales de sonido pulmonar en seis categorías diferentes, para detectar anomalías en las vías respiratorias. Nosotros en particular, además de diagnosticar diabetes, hemos aplicado el aprendizaje de máquina supervisado para pronosticar si un paciente va a sobrevivir o no a una hepatitis, para diagnosticar un cáncer de mama, para predecir una cardiopatía y la respuesta inmune a una vacuna contra la influenza, así como para prevenir que un paciente desarrolle esquizofrenia.

La otra técnica del aprendizaje automático, el aprendizaje no supervisado, lo hemos aprovechado para descubrir terapias inteligentes totalmente personalizadas a través de lo que se conoce como psiquiatría de precisión.

© Sergio López González. Fundación MicroMédix. 23 de junio de 2022


Reseña este artículo y únete a nuestro equipo de teletrabajo


Autor: micromedix

Sergio López González. Ing. en Informática Biomédica

Deja una respuesta

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Salir /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Salir /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Salir /  Cambiar )

Conectando a %s