Medicina Natural

Medicina Alternativa Personalizada. Consultorio


Deja un comentario

Minería de datos clínicos como apoyo en el diagnóstico médico: herramientas y cursos

¿Cómo se puede contar con la opinión consensuada de un centenar de especialistas, sin incurrir en un gasto excesivo? Con un software de minería de datos (data mining) y la capacitación apropiada para comprender bien su operación.
El aprendizaje de máquina está rebasando las expectativas de los médicos y naturópatas que continuamente se actualizan para mejorar sus diagnósticos, e independientemente de si el problema ha de solucionarse con medicina alternativa o alopática, hoy en día ya no basta con la opinión de un solo profesional de la salud para pronosticar si un paciente va a sobrevivir o no a una enfermedad.

Aun cuando un experto haya diagnosticado a un paciente como incurable, no está de más conocer la opinión de un mayor número de colegas. De hecho, hay muchos médicos que estarían encantados de contar con el consenso de otros especialistas del ramo, para corroborar si lo que han dictaminado es realmente irrefutable. Los seres humanos a veces nos equivocamos (falsos positivos/negativos), y eso puede contribuir a que un paciente se rinda a consecuencia del efecto nocebo que un pronóstico médico pesimista suele producir.

El propósito de la minería de datos 

Durante el presente trabajo explicaré cómo es que una rama de la informática biomédica conocida como minería de datos, pone a disposición de un profesional de la salud, la opinión consensuada de cientos de médicos, basándose en los casos atendidos anteriormente por expertos que ni siquiera conoce. ¿Que cómo lo hace? Esa es precisamente la pregunta que a lo largo de este artículo pretendo responder.
Para determinar la condición de un paciente, el especialista tendrá que plantearle unas cuantas preguntas que una herramienta de diagnóstico es capaz de formular automáticamente, basándose en un registro histórico acumulado de cientos de casos.

Por favor no me mal interprete, lo que estoy proponiendo aquí no es remplazar la función del médico con un software de diagnóstico, sino apoyarlo en la toma de decisiones. El software de minería de datos es un recurso más al que se puede recurrir a la hora de emitir un dictamen. Lo más interesante de esta otra herramienta, es que captura y procesa las variables (atributos) recogidas por el resto del instrumental médico, para analizar su influencia en el estado de salud del paciente. La presión arterial, los signos vitales, los síntomas y demás rasgos de un paciente pueden ser registrados y posteriormente analizados simultánea y expeditamente por un programa de minería de datos, a fin de generar un diagnóstico más completo y confiable.

En referencia a la hepatitis por ejemplo, preguntas como ¿está presentando ascitis el paciente?, ¿padece de arañas vasculares? y ¿a cuánto asciende su tiempo de protrombina (rapidez de coagulación sanguínea)?, pueden resultar cruciales al momento de emitir un diagnóstico. Así por ejemplo, cabe la posibilidad de que aun cuando el tiempo de protrombina sea mayor a 43 segundos, el paciente todavía pueda sanar si no presenta ascitis ni arañas vasculares (pulse sobre la imagen adjunta para ver las reglas de decisión que generó la herramienta de software WEKA, una vez que encontré el modelo óptimo de diagnóstico).

Mediante ese mismo modelo, se puede obtener un pronóstico de la esperanza de vida de una mujer que ha llegado a la sala de emergencias experimentando fatiga y arañas vasculares, con un hígado sin endurecimiento; pero con un nivel de albúmina por debajo de los 3.8 g/dl y uno de fosfatasa alcalina inferior a los 147 U/L. ¿Y habría necesidad de internar a otra mujer habiéndole detectado un hígado endurecido, un nivel de albúmina por encima de los 2.8 g/dl y una bilirrubina inferior a los 1.42 mg/dl?
De acuerdo con la tercera regla de decisión del modelo de minería de datos que presenté en la imagen inmediata anterior, la respuesta es no, porque esa última condición ha sido pronosticada por el modelo en cuestión como curable.

Si usted es un(a) hepatólogo(a) con experiencia, es muy probable que algunas de las reglas de decisión anteriormente expuestas le resulten familiares, y tal vez otras le parezcan simplistas o incluso cuestionables. Y lo comprendo, porque quiero suponer que está acostumbrado a efectuar dictámenes más estrictos; pero permítame aclarar que el modelo propuesto, además de ser probabilístico, es perfectible, ya que el número de casos en los que están basadas las reglas anteriores es de 155, que para ser exactos corresponden a 123 casos curables y 32 incurables  (véase la captura de pantalla adjunta). Al pulsar sobre el histograma, notará que la barra roja está representando los casos incurables.

En el campo de la minería de datos, al igual que en la medicina, a medida que aumenta el número de casos atendidos, también lo hace la experiencia acumulada, y con ella, la certidumbre de los diagnósticos. Las máquinas aprenden de manera muy similar a como lo hacen los seres humanos y como alguna vez lo hicieron aquellos programas de computación a los que no hace mucho tiempo se les llamó sistemas expertos, es decir, a través de una base de conocimientos. De manera que usted mismo puede ir optimizando su propio modelo, siempre que vaya integrando más casos a esa base de conocimientos: ese conjunto de casos que ya resolvió en el pasado y que seguirá diagnosticando cada día mejor, conforme pasen los años. El punto aquí es que la máquina y usted aprendan, tanto si aciertan en sus diagnósticos como si no, porque ¿sabe usted cuántas variables predictoras es capaz de manejar simultáneamente un software de minería de datos para diagnosticar un padecimiento? Cientos de ellas.

En el artículo que publiqué bajo el título “La informática biomédica en el diagnóstico y la prevención de la esquizofrenia y otros trastornos de la personalidad“, propuse un modelo con 72 variables predictoras que a la postre optimicé empleando únicamente 35 atributos, mediante una selección apropiada de los mismos. A la izquierda muestro los histogramas de las 15 variables que componen el modelo que les propuse construir a mis participantes, en uno de los cursos que imparto: “Informática Biomédica para el Descubrimiento de Nuevas Terapias y el Diagnóstico de Enfermedades“. Más adelante explico por qué esas 15 variables resultaron ser las más relevantes en el caso de la hepatitis.
Sin una herramienta de minería de datos a la mano, es probable que a un ser humano se le dificulte manejar al mismo tiempo, 15 variables para emitir diagnósticos confiables de hepatitis, o 35 variables en el caso del modelo de diagnóstico para la esquizofrenia. Entiéndase aquí por confiable no tanto la opinión de uno o dos expertos en la materia, sino la precisión que se consigue utilizando un conjunto de datos de prueba, que permiten confrontar los diagnósticos realizados por un algoritmo estadístico-matemático, con lo que opinaron un gran número de expertos en el pasado. Técnicamente hablando, al resultado de esa comparación se le conoce como matriz de confusión (derecha), que no es más que una tabla en donde el analista de datos clínicos puede distinguir los llamados falsos positivos/negativos, de los verdaderos positivos/negativos.

Tendría usted que desarrollar uno de los talleres del curso que mencioné con anterioridad, para aquilatar debidamente el hecho de que un ser humano no es capaz de manejar simultáneamente, ya no digamos 35, sino al menos 15 variables, como para discernir bien entre un falso diagnóstico y otro probablemente correcto. Para una discusión más profunda sobre lo que implicaría por ejemplo, dar de alta a un paciente cuando en realidad sí está presentando una cardiopatía (falso negativo), véase: “Cardiopatías: en las cosas del corazón no basta con una segunda opinión“, también de mi autoría.

Aclarando los conceptos clave de la minería de datos

A reserva de que con el curso de minería de datos usted consiga dominar esa jerga técnica que describe mejor cómo aprende una máquina, considero conveniente explicar sin tanto tecnicismo, algunos conceptos básicos que le ayudarán a comprender el teje y el maneje de esta fascinante área del conocimiento (si desea usted conocer más detalles sobre los temas que se tratan a lo largo del curso, puede pulsar sobre el mapa mental de la derecha para agrandarlo).
Recuerde que si este esfuerzo no bastara para dejar claro los conceptos clave de la minería de datos, para mí siempre será un placer responder cualquier pregunta que quisiera usted plantear a modo de comentario, al final de esta entrega.

Es importante conocer por ejemplo la diferencia que existe entre un modelo y su algoritmo. Un modelo es el efecto que resulta de aplicar un algoritmo a un conjunto de atributos en particular.
El algoritmo por su parte, es una serie de instruciones escritas en algún lenguaje de programación, que al ser aplicadas a ese conjunto de atributos, provocan un cambio en el diagnóstico o variable de salida. A esta variable también se le llama clase, precisamente porque su finalidad es clasificar cada uno de los casos registrados en el pasado.

Los atributos constituyen las variables de entrada al modelo y reciben también el nombre de variables predictoras, porque afectan el comportamiento que tendrá la variable de salida en el futuro, es decir, cuando se trate de diagnosticar casos de pacientes cuyo diagnóstico se desconoce. En la tabla que aparece en la imagen adjunta (pulse sobre la captura de pantalla de la hoja de Excel para agrandarla), cada renglón de la tabla representa un caso de un paciente afectado de hepatitis, cuyo diagnóstico fue determinado en el pasado con dos posibles valores: curable e incurable. Ambos valores están representando a la clase asignada a cada caso en particular.

Así por ejemplo, de los 155 casos de hepatitis que obtuve del repositorio de datos de la Universidad de California con sede en Irvin (solo se muestran los primeros 25), el caso asociado al séptimo renglón de la tabla, que corresponde a una mujer de 51 años que reportó no haber consumido esteroides ni antivirales, y cuyos síntomas estaban caracterizados por la presencia (denotada como en la celda/casilla correspondiente) de fatiga, anorexia, hígado agrandado, bazo palpable y arañas vasculares, fue desahuciada por el médico que la atendió, a pesar de que en ese momento no contaba con los datos de los atributos bilirrubina, fosfatasa alcalina, SGOT (AST o aspartato aminotransferasa), albúmina y tiempo de protrombina (hecho denotado como “?” en la casilla).

El preprocesamiento de los datos y su repercusión en la precisión del modelo

Tan solo con convertir apropiadamente algunas de las variables numéricas a categóricas, sustituir los campos vacíos de estas últimas con el valor de su moda, y remplazar los valores faltantes de las variables numéricas con el promedio de su correspondiente atributo, ya estaríamos aumentando la precisión de un modelo que podríamos usar como referencia, para irlo optimizando sucesivamente (análisis comparativo o benchmarking).
Dentro de las estrategias de aprendizaje supervisado, existen varios algoritmos con los que se puede comenzar a trabajar. En la imagen de la derecha enumero varios de ellos.
Puesto que ya en una publicación anterior utilicé como referencia el algoritmo ZeroR, en esta ocasión recurriré al árbol de decisión J48 como primera aproximación. Este método de aprendizaje selecciona automáticamente los atributos que a “su juicio” son los más relevantes, entendiendo por relevantes aquellos atributos que más afectan al diagnóstico, o que están más correlacionados con éste. La correlación de un atributo con la variable de salida, nos permite ubicarlo dentro de una lista jerárquica, para saber qué tanto puede influir en los diagnósticos. Nótese como las ramas del árbol de decisión mostrado a su izquierda (pulse sobre la imagen para agrandarla), terminan en un nodo al que se le llama “hoja”, en donde se puede conocer el resultado del proceso de clasificación a lo largo del camino (rama) que conduce a ese nodo terminal (curable/incurable, dependiendo ello de los valores de los atributos).

Optimizando el modelo con los atributos de mayor relevancia

En una primera aproximación, mis participantes suelen obtener con el árbol J48 una precisión del 80.64%. No obstante, este cifra no parece muy prometedora si de lo que se trata es pronosticar la posibilidad de sobrevivir a una hepatitis. Conociendo las precisiones que otros investigadores han obtenido en cuanto a diagnósticos de hepatitis se refiere, nuestro trabajo dejaría mucho que desear si no hiciéramos un esfuerzo por mejorar sus respectivas propuestas.

Karthikeyan y Thangaraju [1] por ejemplo, desarrollaron un modelo basado en J48 que exhibió una precisión del 83%, la cual demostraron se puede conseguir también con un árbol de clasificación tipo Random Forest, y una red neuronal multicapa (perceptrón). No quedando conformes con eso, en una etapa posterior encontraron un par de modelos basados en redes bayesianas con un 84% de precisión.
Por su parte, Nilgün y Özgür [2] lograron conseguir una precisión en sus diagnósticos del 84.5%, con las reglas de decisión PART comentadas en un párrafo anterior.

Para no quedarnos atrás, a continuación describiré cómo en el curso de “Solución de Problemas Multidisciplinarios con Minería de Datos“, los participantes construyeron un modelo con una precisión mayor a la que consiguieron los referentes que cité con anterioridad. La diferencia radicó en una mejor selección de los atributos.

Hay varios métodos para determinar cuáles son los atributos más relevantes. En la imagen de la izquierda muestro la lista de las variables consideradas en el modelo inicial, así como las que seleccionamos en el curso, a partir de una jerarquización de las mismas basada en los promedios de sus correlaciones con la variable diagnóstico (listadas en orden descendente). Como se advierte en esa misma captura de pantalla (pulse sobre la misma para agrandarla), los atributos que terminamos descartando fueron los que aparecen resaltados en amarillo: esteroides, anorexia, hígado agrandado y SGOT. Los demás fueron los que escogimos como los más relevantes.
El procedimiento que se sigue para descartar o conservar los diferentes atributos forma parte de lo que se conoce como calibración del modelo, y constituye todo un apartado dentro del temario del curso “Solución de Problemas Multidisciplinarios con Minería de Datos“. Para los efectos de este trabajo, lo importante no es tanto saber cómo se seleccionaron los atributos, sino qué variables resultaron ser las más relevantes, y cómo afecta dicha selección la precisión de los diagnósticos. En la imagen de la derecha presento un cuadro resumen de los modelos evaluados a lo largo del taller, con sus correspondientes coeficientes estadísticos. Si desea saber para qué sirven estos parámetros, le recomiendo consultar: Cardiopatías: en las cosas del corazón no basta con una segunda opinión; ahí expliqué con mayor detenimiento algunas de sus propiedades.

El análisis de los datos: una alternativa para optimizar el modelo

De acuerdo con la tabla anterior, el modelo que resultó de aplicar las reglas de decisión PART a los 15 atributos previamente seleccionados, fue sin lugar a dudas el mejor, por habernos entregado en el menor tiempo posible, una precisión del 88.38%, con un coefficiente de Kappa mayor a todos los demás y una tasa de error mínima.

Aun cuando hay autores que afirman haber encontrado precisiones mayores a las que aquí estamos reportando [3]-[4], para los propósitos del taller que mis participantes estaban cursando, dicha cifra fue más que suficiente, pues superó en 3.8 puntos porcentuales, los resultados conseguidos por esos otros dos referentes anteriormente mencionados (análisis comparativo). Y aunque la jerarquización de correlaciones promediadas es un método más formal que el análisis de los datos, ésta otra técnica se podría aplicar también para seleccionar los atributos que más influyen en el diagnóstico.

El análisis de datos no requiere de operaciones matemáticas laboriosas pero sí de cierta habilidad para interpretar histogramas y detectar correlaciones entre atributos. Dos atributos están correlacionados cuando uno depende del otro, y uno de los dos se puede descartar en caso de confirmarse una correlación entre ellos.

La independencia entre dos atributos se puede comprobar matemáticamente con el teorema de Bayes. No obstante, una correlación de atributos se puede inferir también a partir de su diagrama de dispersión. Habrá situaciones sin embargo en las que no se podrá descartar un atributo, por estar correlacionado tanto con otro atributo como con la variable de salida. Tal es el caso de la albúmina, la ascitis y el diagnóstico de la hepatitis.  Sabiendo que un nivel anormalmente bajo de albúmina constituye un rasgo de daño hepático grave, y que una cantidad insuficiente de albúmina podría estar implicando una ascitis, se intuye que debe haber una correlación entre las variables de entrada ascitis y albúmina. Pero de acuerdo con los promedios jerarquizados de las correlaciones entre cada una de estas variables y el diagnóstico, todo indica que no podríamos descartar ninguna de ellas, porque ya vimos que ambas ejercen un gran impacto en la variable de salida.
De acuerdo con el histograma mostrado a la izquierda, los pacientes con menos posibilidades de sobrevivir (área en color rojo) suelen ser los que presentan el nivel de albúmina mas bajo. Análogamente, observe en la captura de pantalla de la derecha, cómo la ascitis impacta de manera muy marcada en la esperanza de vida: el porcentaje de los casos incurables (en rojo), es mucho mayor en los casos de ascitis que en aquellos en los que no se detectó acumulación de líquido en el abdomen.

En contraste con los dos atributos anteriores, mediante un análisis de los histogramas asociados a las variables esteroides, anorexia, hígado agrandado y SGOT, puede uno fácilmente darse cuenta del poco impacto que ejercen éstas en el diagnóstico.

A modo de ejemplo, obsérvese la variación del atributo esteroides en la captura de pantalla de la imagen adjunta. El histograma revela que el porcentaje de pacientes que sobrevivieron y que no consumían esteroides fue del 73% aproximadamente, mientras que el porcentaje de los que sobrevivieron y que sí consumían esteroides fue del  87%. Como yo lo veo, no hay una gran diferencia entre consumir o no esteroides, si de lo que se trata es pronosticar lo que sucederá después de haber contraído una hepatitis, cualesquiera que sea su tipo (A,B,C,D,E, F o G). Considero que esa diferencia de tan solo el 14%, es suficiente para contemplar la posibilidad de descartar este atributo de nuestra lista de variables relevantes.

Pero entonces… ¿Qué diagnóstico le entregaría usted al paciente que acaba de llegar a su consultorio?

Prueba de validación y confiabilidad del modelo

Una vez habiendo evaluado al menos 3 modelos y seleccionado uno de ellos como el óptimo, lo que resta es ingresar los datos de uno o más pacientes a nuestra herramienta de diagnóstico. En la imagen de la derecha estoy mostrando lo que el software WEKA me entregó al sustituir la opción de prueba conocida en el argot de la minería de datos como validación cruzada (indicada en la imagen de la derecha como Cross-validation), por la opción suministro de datos de validación (Supplied test set). Este conjunto de datos constituye el archivo de pacientes a diagnosticar, o mejor dicho, representa los valores de los atributos de unos pacientes cuyos datos no están en ningún repositorio de California, sino en el archivo clínico del hospital o de la institución en donde el médico o naturópata trabaja.
Supóngase que los casos a diagnosticar corresponden a seis pacientes, con los síntomas y datos de validación que aparecen en la hoja de datos de la izquierda. Note que el campo correspondiente a la variable de salida diagnóstico, contiene un signo de interrogación, el cual se ha ingresado así deliberadamente, porque al momento de ingresar los datos, el diagnóstico aún es una incógnita.
En el momento que le decimos a WEKA “arráncate”, pulsando sobre el botón etiquetado como Start, este software aplica el algoritmo PART a los 15 atributos de los que consta cada uno de los 155 casos almacenados en la memoria de la máquina, con la diferencia de que esta vez ya no emplea una validación cruzada. En lugar de tomar la décima parte de los datos de entrenamiento como datos de prueba (de ahí que Folds=10), sustituye a éstos con los datos de nuestros pacientes para realizar sus diagnósticos. Esos datos son los que aparecen en la imagen de la izquierda.

¿Cuál sería entonces el diagnóstico del paciente con lo datos de la instancia (caso) #1? (véanse de nuevo las últimas dos imágenes). La respuesta se traduciría como una esperanza de vida del 96.7%, puesto que fue diagnosticado como curable. ¿Y que me dice de la esperanza de vida del paciente con los datos de la instancia #6 ? Ahora el panorama es desolador, porque basándonos en las cifras que ha entregado la herramienta de diagnóstico, inferimos que  la esperanza de vida para este paciente es del 14.3%, dado que fue diagnosticado como incurable. ¿Pero qué tan confiables son estos diagnósticos?

Hemos visto que la bondad de un modelo depende del algoritmo y de los atributos seleccionados. Pero tenemos que ser muy cuidadosos a la hora de interpretar los resultados, porque las evaluaciones de los cuatro modelos anteriormente analizados, fueron realizadas empleando una validación cruzada. Si fuéramos más estrictos, tendríamos que hacer una segunda evaluación, usando los mismos datos de entrenamiento del repositorio de Irvin; pero con un conjunto de datos de prueba mucho mayor que el archivo de 6 pacientes que usaron mis participantes en el taller, en donde no debería faltar el valor de la clase. En estas condiciones, el modelo seguiría siendo el mismo pero aprendería más de sus errores, como resultado de la comparación de los valores diagnosticados con los reales.

Como cabría esperar, bajo este nuevo esquema el modelo arrojaría una precisión ciertamente menor; pero más confiable (realista) que la que obtuvimos aquí con la validación cruzada.

Conclusiones

1) La confiabilidad de un modelo crecerá conforme aumente el número de casos, tanto de los que se usan para entrenarlo, como los que sirven para probarlo. Entre más grande sean el volumen y la calidad de los datos, más confiables serán los diagnósticos.
2) La precisión de un modelo depende tanto del algoritmo como de los atributos seleccionados.
3) Además de la precisión y el tiempo de ejecución, la evaluación de un modelo debe considerar también ciertos parámetros estadísticos, como son el coeficiente de Kappa, la raíz del error cuadrático medio y la matriz de confusión, por mencionar los más importantes.

4) Una herramienta de minería de datos fácil de usar y gratuita, así como una buena capacitación, aumentan la competitividad de un profesional de la salud, pues no es lo mismo confiar en la experiencia de un solo experto, que considerar el consenso de un gran número de especialistas.
5) El descubrimiento de tendencias y patrones en un gran volumen de datos de buena calidad, contribuye más a minimizar los diagnósticos falsos positivos/negativos y a maximizar los pronósticos verdaderos positivos/negativos, que cuando se opta exclusivamente por la auscultación, la vigilancia de signos vitales, los exámenes de laboratorio y el seguimiento de la evolución de síntomas y rasgos del paciente.

Tanto en la medicina como en los demás campos del saber, los datos pueden reflejar una realidad que no es posible descubrir a través de la lectura o del estudio de una que otra hipótesis científica, sino por medio de la interpretación apropiada de una tendencia, un patrón, o de esa pista que nos ayudará a comprender mejor los misterios de la naturaleza, y que nos ampliará aún más la visión que tenemos del mundo que nos rodea. Hay algo en los datos que no está en los libros y que es menester descubrir: el conocimiento.

“No hay inversión más rentable que la del conocimiento” … Benjamin Franklin
© Sergio López González. Fundación MicroMédix. 16 de abril de 2018


¿No encontraste aquí lo que buscabas? En el índice temático hay más artículos que te pueden interesar


REFERENCIAS

[1] Karthikeyan & Thangaraju. Analysis of Classification Algorithms Applied to Hepatitis Patients. International Journal of Computer Applications (0975 – 8887), Volume 62– No.15, January 2013.
[2] Nilgün & Özgür. Evaluation of risk of death in hepatitis by rule induction algorithms. Scientific Research and Essays Vol. 5(20), pp. 3059-3062, 18 October, 2010.
[3] Fadl Mutaher Ba-Alwi, Houzifa M. Hintaya. Comparative Study For Analysis The Prognostic In Hepatitis Data: Data Mining Approach. International Journal of Scientific & Engineering Research, Volume 4, Issue 8, August-2013.
[4] Pushpalatha & Pandya. Data model comparison for Hepatitis diagnosis. International Journal of Emerging Research in Management & Technology. ISSN: 2278-9359 (Volume-3, Issue-7).

Anuncios


9 comentarios

La informática biomédica en el diagnóstico y la prevención de la esquizofrenia y otros trastornos de la personalidad

En esta entrega explico cómo es que las técnicas de la informática biomédica, consiguen que una máquina aprenda a diagnosticar y prevenir trastornos de la personalidad, apoyándose en la experiencia de los médicos. Un doctor en medicina aprende más de los casos que atiende y resuelve durante el ejercicio de su profesión, que de lo que sus maestros le enseñaron en la universidad. Emite sus diagnósticos basándose en sus casos de éxito, así como en los datos que le muestran los instrumentos que utiliza y en lo que develan las pruebas de laboratorio que recomienda efectuar, pero sobre todo, en los síntomas que le reportan sus pacientes.

La mayoría de los trastornos mentales suelen estar caracterizados por cierto número de síntomas y/o rasgos de personalidad, y parte de este trabajo ha consistido en asociar una variable a cada uno de esos rasgos. Los médicos acostumbran llamar síndrome a un complejo de síntomas, y lo que los especialistas en informática biomédica hemos logrado a lo largo de la presente investigación, ha sido clasificar cada variable (síntoma/rasgo) en su respectivo síndrome. No obstante, para estar en total consonancia con lo que los expertos en medicina ortomolecular establecen en relación a los grados de metilación [1], hemos preferido llamar fenotipo a cada síndrome. En este orden de ideas, vale decir que los fenotipos no son tipos de esquizofrenia, sino síndromes que trastornan de diferentes maneras, la conducta de un ser humano.

¿Pueden las máquinas aprender de la experiencia médica?

Al plantearles preguntas que se pueden contestar con un “sí” o con un “no”, el médico descubre ciertos patrones y una que otra relación entre los diferentes síntomas de sus pacientes. Cuando usted acude a la consulta, seguramente tendrá que responder a una serie de cuestionamientos del tipo: ¿le duele la cabeza?, ¿le zumban los oídos?, ¿se marea cuando se levanta de la cama?, ¿le arde al orinar?, ¿practica ejercicio?, ¿fuma?, ¿toma bebidas alcoholicas?, etc.
Una máquina puede aprovechar la experiencia de cientos de médicos para aprender también de los casos que ellos han resuelto en el pasado. Hoy, en plena era del conocimiento, uno puede ser testigo de cómo una computadora aprende a diagnosticar pacientes, a partir de miles de casos almacenados en un archivo clínico. Mientras mayor sea el número de registros en esa base de datos, mayor será la experiencia acumulada, más precisos serán los nuevos diagnósticos y menor el riesgo de desarrollar una enfermedad.
Al igual que el médico, el ingeniero en informática biomédica también dispone de herramientas, pruebas de laboratorio y cuestionarios para conseguir que sus pacientes restablezcan su salud, o mejor aún, para prevenirlos de una determinada enfermedad. Ya lo dice el adagio, “más vale prevenir que lamentar”.

Y aunque ese refrán contiene mucho de verdad, no parece haber permeado mucho en nuestra sociedad.
A juzgar por la cantidad de casos de esquizofrenia que hemos estado atendiendo de un tiempo para acá, la idea de que “eso es algo que a mi o a mi familia no nos puede pasar“, es la que hoy por hoy ha estado predominando y produciendo muchos sinsabores alrededor del mundo.  Como veremos a continuación, confiar en que esa aseveración es cierta es tanto como echar una moneda al aire y esperar ganar el volado. Si esa idea ha cruzado por su mente aunque sea una sola vez, y toca la casualidad de que es usted padre o madre de un adolescente, creo que lo mejor que puede hacer en este momento es seguir leyendo.

El diagnóstico preventivo: la clave para no enfermarse o evitar las recaídas 

En la imagen adjunta muestro una fracción del archivo de pacientes con trastornos de personalidad de la Fundación MicroMédix (pulse sobre la misma para agrandarla). Los 72 síntomas los consideramos nuestras variables de entrada, y la hoja de Excel que ahí aparece es de lo que se alimenta la herramienta que usamos para analizar los datos. La variable de salida es el fenotipo y  sus valores pueden ser cinco: histapenia, histadelia, piroluria, normal y otro. Los criterios para la asignación de dichos valores los establecimos de acuerdo con las especificaciones de los doctores Walsh, Stuckey y Lambert, para los grados de metilación y el extrés oxidativo de sus pacientes [1], [2] (véase también “Identificando el fenotipo de esquizofrenia: un paso más hacia la curación“).

Como cabría esperar, cada paciente presenta síntomas acorde con su individualidad bioquímica, y por lo tanto, con su epigenética. Así por ejemplo, el registro asociado al paciente con expediente No. 9 indica que éste ha sido diagnosticado con histapenia porque escucha voces, no sufre de ansiedad ni ataques de pánico, no es hiperactivo, manifiesta un interés excesivo en los asuntos religiosos (muy_devoto), no presenta síndrome de piernas inquietas, no reporta paranoia, tiene problemas de insomnio, padece acúfenos, y así continuaríamos interpretando los demás campos de este registro en particular, hasta llegar al atributo No. 72 del archivo. Es por esta razón que a los pacientes o a sus familiares les pedimos que contesten únicamente sí (S) o no (N), a las preguntas del cuestionario que hemos puesto aquí a su alcance para conocer sus síntomas.

Algunos de nuestros lectores, en especial los padres de hijos aquejados de algún trastorno de personalidad, ya se han dado cuenta de la importancia que tiene el responder al cuestionario con el tipo de preguntas que cité con anterioridad (S/N), pues desde que comenzamos a identificar los fenotipos de esquizofrenia por ejemplo, sus hijos han comenzado a responder mejor al tratamiento, como resultado del conocimiento adquirido al aplicar la técnica de la minería de datos a sus síntomas. Ya en otra parte de esta misma página web escribí: “el conocimiento que no se tiene, debe descubrirse“.

Al igual que la extracción de texto (text mining), la minería de datos (data mining) nos permite descubrir ese conocimiento que aparentemente no existe en un conjunto de datos como los de la hoja de cálculo que mostré con anterioridad.
Más adelante demostraré, cómo la aplicación de algunos algoritmos de la minería de datos a los síntomas de un paciente, nos está permitiendo diagnosticar su fenotipo, evitar que enferme, o prevenirlo de una recaída. Cada vez que predecimos el fenotipo que podría desarrollar un paciente, estamos mejorando la calidad de vida de una familia, pues solo así es posible administrar a tiempo, los nutrientes que la medicina ortomolecular recomienda justo para ese fenotipo. Es imperativo prevenir recaídas o evitar que un problema se complique, hasta el punto de tener que recurrir al confinamiento y la medicación psiquiátrica.

Un ejemplo sencillo de aprendizaje basado en casos 

El aprendizaje automático o de máquina emplea un algoritmo para clasificar, diagnosticar o predecir el resultado de una observación (caso) que se ve influenciado por el comportamiento de una o más variables predictoras (de entrada). Para entender mejor el concepto, explicaré su principio de funcionamiento con un ejemplo muy sencillo.
Durante algún tiempo, mi hermana solía preparar bacalao para agasajar a toda la familia en la cena del 24 de diciembre. En ciertas ocasiones el bacalao era todo un éxito, y en otras, en opinión de mi señor padre, no tanto.

Digamos que las variables de entrada eran solo tres (la verdad es que eran muchas más; pero como soy un lego en materia culinaria y en estos momentos no cuento con la asesoría de mi querida hermana, voy a simplificar las cosas): lugar en donde era adquirido el bacalao, tiempo de recalentado y tiempo de remojado previo.
Cuando el bacalao se compraba en “La Europea”, el éxito casi siempre estaba asegurado, excepto aquella vez que mi hermana lo recalentó por más tiempo del que era necesario, y se agrió.

Las veces que salía “sacatudo”, duro o salado (fracaso), era porque no se había puesto a remojar el tiempo suficiente. En fin, eran variables que influían sensiblemente en la variable a predecir: la opinión de mi papá sobre la calidad del bacalao en la cena de navidad.
Lo interesante de este ejemplo es analizar si Maricarmen descubrió un método para preparar el bacalao, basándose en lo que había ocurrido en las navidades anteriores. Y más interesante aún sería el poder predecir cuál será el resultado de esta navidad, tomando en cuenta que uno de mis sobrinos planea comprar el bacalao en el Mercado de San Juan y que va a darnos la sorpresa justo el 24 de diciembre.

Dado que Mari Carmen va a recibir el bacalao con tan poco tiempo de anticipación, lo más seguro es que no pueda dejarlo remojar lo suficiente. Estando así las cosas, ¿cuál podría ser la opinión de mi papá, sabiendo que el bacalao solo va a poderse remojar durante 6 horas?
Si pulsa usted sobre la imagen anterior para agrandarla, va a advertir que no existe un caso resgitrado en la base de datos, para el que la variable de entrada Lugar de compra sea igual a “Mercado de San Juan” y la variable Tiempo de remojado sea de 6 horas; en otras palabras, no existe un antecedente de lo que podría pasar, dadas estas condiciones. Sin embargo, la minería de datos podría ayudarnos a predecir si el bacalao va a ser un éxito o no esta navidad, con cierto nivel de precisión (probabilidad). ¿O podría usted intuitivamente darme un pronóstico con algún nivel de certidumbre?

La regla del ZeroR

Hay un método muy rudimentario que podríamos aplicar al ejemplo anterior. Consiste en analizar cuál es el resultado que más ocurrencias ha registrado y predecir de acuerdo con éste. En estadística, al valor que se repite con más frecuencia en un conjunto de datos se le llama moda. En la matriz de datos del ejemplo anterior, observamos que en la mayoría de los casos el bacalao ha sido un éxito. El éxito sería la moda en este caso, y espero quede claro que así ha sido en el  71.42% de las veces (100 x número de éxitos/total de observaciones = 100 x 5/7 %). Así, nuestro pronóstico sería que aunque el bacalao se quede remojando 6 horas, el resultado va a ser un éxito, con una margen de error del 28.58%.

En los ámbitos de la minería de datos y la estadística, al método que acabamos de emplear aquí para responder a la interrogante planteada al final del apartado anterior, se le conoce como regla del ZeroRy aunque simple en su naturaleza, nos sirvió mucho al momento de evaluar el método que seleccionamos para diagnosticar a nuestros pacientes. A continuación analizo las características de los métodos y herramientas que estuvimos evaluando en la Fundación MicroMédix, antes de seleccionar el algoritmo que a la postre nos proporcionó el mayor nivel de certidumbre, con miras a diagnosticar y prevenir trastornos de personalidad.

Métodos y herramientas para diagnosticar y prevenir la esquizofrenia y otros trastornos de la personalidad

Analicemos ahora el caso de un modelo para diagnosticar a un paciente, cuya madre nos ha escrito en busca de ayuda, pues su hijo padece de queratocono (por favor pulse en el vínculo que sigue si desea conocer los detalles de este trastorno y del caso completo de “Alejandro de Austria”). Para ello, les pedimos nos hicieran favor de responder el cuestionario de 72 preguntas, que estarán representando las variables de entrada de nuestro modelo de diagnóstico/prevención de fenotipo, tal y como lo describí en la sección “El diagnóstico preventivo: la clave para no enfermarse o evitar las recaídas”.

Cada variable (síntoma implícito en cada pregunta) únicamente puede asumir los valores S y N, dependiendo si la respuesta de esta admirable madre guerrera ha sido un sí o un no, respectivamente. Como se ve, ahora nuestro reto consiste en manejar 72 variables dicotómicas (S/N) y una variabe categórica de salida (las variables categóricas son aquellas que solo pueden adquirir valores que se pueden enumerar, y que por lo tanto no son continuas).
Antes de cargar los datos del paciente a nuestra base de datos, es necesario abrir primero este archivo con el software de minería de datos, y una vez seleccionado el modelo de diagnóstico, ingresar los síntomas que el paciente ha reportado, en un archivo de prueba (test). Nótese que no podemos (ni debemos) integrar los síntomas de un paciente a la base de datos, antes de ejecutar el algoritmo de diagnóstico, porque desconocemos su fenotipo. Esta es justamente la variable que pretendemos determinar con el software de minería de datos, y es por eso que a ésta se le llama variable de salida.

WEKA (Waikato Environment for Knowledge Analysis) es el software de minería de datos (derecha) que hemos estado usando desde hace años, con el fin de perfeccionar nuestras recetas, y fue desarrollado por la universidad de Waikato, Nueva Zelanda, en la modalidad de distribución gratuita (open source). Si pulsa usted sobre la captura de pantalla de la derecha, notará que WEKA  a empleado un diagrama de barras para representar el número de casos registrados para cada fenotipo. Hay 8 pacientes etiquetados con el fenotipo otro, 40 con histapenia (en rojo), 30 con histadelia (azul celeste), 2 normales (gris) y 20  diagnosticados con piroluria (en rosa).
Ahora que ya conoce usted el método del ZeroR, supongo que no tendrá problemas para emitir un diagnóstico aunque sea burdo del fenotipo de “Alejandro de Austria”. Aplicando el método que anteriormente expliqué “con manzanitas”… ¡ah perdón!, ¿fue con bacalao no es cierto? Bueno, acorde con la regla del ZeroR, un pronóstico no muy bueno sería el de histapenia, con un 40% de confianza (pulse sobre la imagen de la izquierda para ver lo que WEKA despliega al aplicar este método).

Dijimos que este valor corresponde a la moda de la variable fenotipo (en el sentido estadístico del término, no porque esté de moda hacerlo así), y aunque impreciso, nos servirá como referencia para evaluar el método que usaremos para emitir diagnósticos más serios y predicciones más certeras. Porque imagínese nada más, querido lector, cómo confiar en un diagnóstico cuyo margen de error es del 60%. Note y anote los valores del coeficiente Kappa de Cohen y el de la raíz del error cuadrático medio porque son factores que nos indican qué tanto nos estamos equivocando en los diagnósticos.

Como por el momento no se trata de impartir un curso de informática biomédica o de estadística, sino únicamente saber para qué nos van a servir ambos parámetros, baste decir que entre más cerca esté de la unidad el coeficiente de Kappa, más preciso será el modelo seleccionado, y que entre más pequeña sea la raíz del error cuadrático medio, menos errores estaremos cometiendo y mejor será el modelo objeto de análisis.
Un criterio de seleción basado en la regla del ZeroR es completamente inadmisible, aunque en honor a la verdad, sé de algunos psiquiatras con criterios de diagnóstico peores, pues en lo único que se basan es en su “Manual Diagnóstico y Estadístico de los Trastornos Mentales (DSM)”, o a veces ni siquiera en eso. Estimado lector, permítame informarle que ese manual no contiene absolutamente nada de estadística. Si hay algo estadístico y dotado de inteligencia que sí nos puede ayudar a diagnosticar con bastante precisión a nuestros pacientes, son sin duda alguna los árboles de decisión, las redes bayesianas y las redes neuronales artificiales.

Árboles de decisión y selección de atributos

Si un modelo con 3 variables de entrada y una de salida ocasiona cierta incertidumbre a la hora de pronosticar cómo va a estar el bacalao esta navidad, imagínese lo que implica uno con 72 variables de entrada que pretende diagnosticar o predecir el fenotipo de un paciente. Las cosas pueden complicarse sobremanera. Y aunque la máquina sea la que se va encargar de ejecutar los algoritmos, el reducir el número de variables de entrada no solo simpifica los cálculos y el análisis de los datos, sino que podría aumentar el nivel de precisión del modelo. En seguida le explico qué fue lo que hice para reducir el modelo inicial de 72 variables de entrada, a uno de 35 atributos, aumentando al mismo tiempo el nivel de precisión de los diagnósticos y las predicciones.

Después de haber abierto con WEKA el archivo de pacientes, pulsé en la pestaña Classify para acceder a la función de clasificación de instancias (casos), y luego seleccioné el algoritmo J48, dentro de la categoría correspondiente a los árboles de decisión. Al dar clic en el botón de arranque (Start), lo que obtuve fue un coeficiente de Kappa de 0.605, una raíz del error cuadrático medio de 0.3174 y un nivel de precisión del 72%. (pulse usted sobre la imagen que aparece a su izquierda para ver los detalles). Esta precisión, si bien ha resultado muy superior a la que nos ofrece la regla del ZeroR, no es precisamente lo que una madre guerrera estaría esperando para optimizar la receta de su hijo.

Pero entonces, ¿para qué seleccionar un método que se está equivocando el 28% de las veces?
Mi intención al seleccionar el método del árbol de decisión J48, además de comparar su precisión con la del ZeroR, era analizar los síntomas que seleccionaría este algoritmo.

Los árboles de decisión nos ahorran el trabajo de seleccionar los atributos más relevantes, de entre todos los datos del conjunto (en este caso los síntomas del paciente). Y lo que llama más la atención es que lo hacen de manera automática. Uno no tiene que ir a la pestaña Select attributes de WEKA para seleccionar un evaluador de atributos y luego probar con más de una estrategia de búsqueda, a fin de intentar aumentar la precisión del modelo. Se requiere conocer bien el tema para obtener un buen resultado, haciéndolo explícitamente.
Tratando de ahorrarme el trabajo de ahondar en el tema (lo cual, como veremos más adelante terminé haciéndolo de todas maneras), quise saber lo que harían WEKA y el árbol J48 al pedirles que me mostraran el diagrama que “tenían en mente”.

La inteligencia de estas herramientas es tal, que nos permiten ver cosas que no podríamos descubrir por nosotros mismos. ¿O sabe usted de algún psiquiatra que le pueda decir cuál de todos los síntomas de la esquizorenia influye más en sus diagnósticos? Quiero pensar que se inclinaría por la escucha de voces, las alucinaciones visuales, las obsesiones o las compulsiones.

Pero lo que importa aquí no es lo que tenga que opinar un psiquiatra al respecto, sino lo que WEKA y el J48 puedan develar en el proceso. Estos dos aliados nos están diciendo que hay un 72% de probabilidades de que los problemas psicogénicos de la población de pacientes de nuestra base de datos, podrían estar relacionados con el hecho de tener canas prematuras (fíjese en el nodo raíz del árbol que aparecerá en su pantalla, después de pulsar sobre la imagen adjunta). Ya lo estoy oyendo decir: ¡con el encanecimiento prematuro! Sí querido lector, leyó usted bien. Y tiene mucho más sentido cuando uno va y busca en Google, las causas más importantes del encanecimiento prematuro.

Si usted indaga lo suficiente sobre esta cuestión, lo que va encontrar en la mayoría de los sitios web, es que las canas prematuras son un claro indicio de deficiencia de vitaminas, minerales y sobre todo de melanina. Hay muchas evidencias de que las canas aparecen antes de lo normal, cuando uno está sujeto a un estrés constante. Los editores de la revista Scientific American lo han dejado muy claro: el estrés provoca que nuestro cabello se tiña de gris, y en casos extremos, de blanco.

En este mismo diagrama de árbol se puede ver cómo éste método dignostica a un paciente, a partir de las decisiones que va tomando a lo largo de las ramas que conducen a las hojas etiquetadas como histapenia, histadelia, piroluria y otro. Las hojas del árbol son los nodos terminales. Para ejemplifiar como funciona este método de extracción de datos (data mining), siga la rama que marqué con rojo, en el siguiente orden:

1. El algoritmo comprueba que el paciente ha contestado que NO a la pregunta ¿tiene canas prematuras (variable de mayor relevancia según este método)?, por lo que decide ir a verificar la respuesta al nodo etiquetado como obsesivo-compulsivo (siguiente variable de importancia de acuerdo con este método).
2. Ahí comprueba que NO es obsesivo-compulsivo y continúa con la pregunta 3:
3. ¿Rasgos faciales delicados? Como la respuesta aquí es afirmativa, va en busca del nodo mal_genio.
4. Puesto que en este último nodo la respuesta es , J48 concluye que se trata de una piroluria (en la hoja de esta “rama roja” del árbol).

A pesar de toda esa inteligencia, una precisión del 72 % no garantiza el éxito de un tratamiento, por lo que es imprescindible buscar un modelo que nos ofrezca al menos un 90% de confianza.
Pensando que los atributos que había seleccionado el árbol J48 me servirían como entrada para otro método de árbol, o bien para una red bayesiana, probé con los árboles LMT y Random Forest, así como con un par de algoritmos bayesianos. Aún así, los resultados todavía dejaban mucho que desear.
Así las cosas, había que seleccionar los atributos más significativos de manera explícita, con los medios que ofrece WEKA.
Una vez que supe cuál sería una buena estrategia para la selección de atributos, decidí probar con el evaluador por omisión (CfsSubsetEval) y el método de búsqueda Best First. El resultado de esta fase del proyecto aparece en la captura de pantalla que se muestra a la izquierda. Como se ve, esta vez son 35 los atributos que de acuerdo con este último hallazgo, debería yo emplear de aquí en adelante como variables de entrada en mis evaluaciones.   En la imagen de la derecha se puede apreciar cómo se distribuye la variable escucha_voces en función del fenotipo, después de haberla seleccionado en la interfaz de pre-procesamiento. De todos los pacientes, hay 53 que no escuchan voces y 47 que sí lo hacen. Se observa también que los pacientes que han sido diagnosticados con histapenia, son los que más escuchan voces (área en rojo).

Pero más que estar buscando un método que mejore los diagnósticos, lo que más nos importa en la Fundación MicroMédix, es evaluar qué tanto un adolescente podría estar en riesgo de desarrollar un problema psicogénico, caracterizado por cualquiera de los fenotipos que aquí hemos estado analizando. Nos interesa por ejemplo encontrar un modelo de diagnóstico que nos permita responder a preguntas del tipo: ¿qué tan probable es que un muchacho se empiece a aislar de sus amigos y familiares, habiendo sido diagnosticado con histadelia? Una posibilidad es recurrir a los métodos dotados de inteligencia artificial, entre los que destacan las redes bayesianas. A continuación exploramos esa posibilidad.

El método de red bayesiana que hizo posible aumentar la precisión hasta en un 92%

Provisto de un conjunto de atributos optimizado, me di a la tarea de probar varios métodos, tanto de árboles de decisión como de redes bayesianas. Fue así como obtuve los mejores resultados.

A lo largo de este proceso de búsqueda, advertí que efectivamente los atributos que habia seleccionado de manera explícita, habían producido un aumento en las precisiones tanto en uno de los tres árboles de clasificación, como en los dos métodos bayesianos que elegí. Excepto para los casos de los árboles de decisión J48 y LMT, los demás métodos superaron a sus antecesores. En el caso del Random Forest la precisión llegó a ser del 90%. En la tabla adjunta muestro el resumen de las pruebas que tuve que realizar para finalmente adoptar como modelo de diagnóstico el de Bayes Net, no solo por haberme entregado la mejor precisión (del 92%), sino los mejores coeficientes estadísticos.

¿Recuerda lo que le comenté sobre los parámetros Kappa de Cohen y de la raíz del error cuadrático medio? Bueno, pues fue así como supe cuál era el mejor de los seis métodos analizados. El modelo a emplear terminó siendo el método de Bayes Net aplicado a las 35 variables que de acuerdo con WEKA, resultaron ser las más relevantes.

Con este modelo ya podemos responder a ese tipo de preguntas que nos permiten evaluar el riesgo que tiene una persona de enfermar. Con la inteligencia artificial de un método como el de Bayes Net, podemos determinar qué probabilidades tiene un paciente de padecer un síntoma, dado su fenotipo. En la imagen adjunta por ejemplo (pulse para agrandarla), se pueden conocer las probabilidades que tendría un adolescente de escuchar voces, de experimentar delirios, de no recordar sus sueños y de aislarse de sus familiares y amigos, dependiendo todo ello de su fenotipo. Así, de haber sido diagnosticado con histapenia, dichas probabilidades serían del 74.4%, 59.8%, 30.5% y 54.9%, respectivamente.

Uno de los principales objetivos al desarrollar un sistema de esta naturaleza, es evitar que los síntomas asociados a cualquiera de los fenotipos mencionados, hagan su triunfal aparición. Sin embargo, no hay que perder de vista que estamos ante un modelo probabilístico, y hay que ser my cautelosos a la hora de interpretar los resultados. Note por ejemplo que en la tabla de distribución de probabilidades de la figura anterior, se establece que la probabilidad de que un paciente normal escuche voces no es nula, lo cual no significa que esté en riesgo, sino simplemente que el modelo no es determinístico y que existe por lo tanto, un margen de error del 8%. No está nada mal.

Diagnosticando a un paciente con queratocono: ¿un fenotipo que podría clasificarse como “otro”?

Regresando al caso de “Alejandro de Austria”, es menester aplicar todo el conocimiento adquirido hasta aquí, para determinar con una precisión del 92%, el fenotipo de nuestro querido amigo.
El objetivo es tener una idea más clara de cuál puede ser este fenotipo, a fin de perfeccionar su receta.
En la captura de pantalla adjunta, estoy mostrando el diagnóstico que WEKA me entregó, al ingresar las respuestas que la mamá de este chico anotó en el cuestionario para identificar su fenotipo. En el conjunto de datos de prueba (test set), incluí a otros seis pacientes que estaban esperando su diagnóstico (pulse sobre la imagen para ver los detalles).

De acuerdo con lo que hasta hora sabemos sobre Alejandro, mi expectativa era que el resultado fuera fenotipo=”otro”; pero lo que el programa de minería de datos me entregó con una certidumbre del 99.2% fue “histapenia”, según se ve en el informe de la imagen anterior (inst# 7). A reserva de lo que revelen las pruebas de laboratorio a realizar en este caso, le estaremos enviando a este madre guerrera, una receta que tome en cuenta tanto el diagnóstico aquí obtenido, como los resultados de dichos análisis.

Obsérvese que en esa misma imagen hay dos pacientes que el modelo diagnosticó con histadelia. En el caso número 3 sin embargo (inst# 3), el programa no parace estar muy seguro de ese diagnóstico y por ende, nosotros tampoco. La certidumbre en este caso ha sido del 47.1%. Al revisar el registro de los datos de este paciente caí en la cuenta de que había dejado muchas preguntas sin contestar, y de alguna manera Bayes Net no se quiso comprometer. Asimismo, quise ponerlo a prueba ingresando un registro de un paciente que ya estaba dado de alta en la base de datos. Si Bayes Net hablara (poco le falta) me hubiera dicho: “a este señor ya lo conozco, es el que se subió a la rama roja de tu árbol J48, y te garantizo (100%) que es pirolúrico”. Nada más faltó que después de haberle borrado la variable que contenía la edad de los pacientes, me dijera que no se tratataba de un adolescente, sino de un “baby boomer”.

Conclusiones

La esquizofrenia, el trastorno bipolar, el autismo, la ansiedad, la depresión, los ataques de pánico y demás trastornos de la personalidad, son enfermedades multivariables, pues son demasiados síntomas los que entran en  juego a la hora de diagnosticar y prescribir. No es fácil determinar cuánto va a durar un tratamiento, ni qué tan bien va a responder un paciente a los suplementos que la medicina ortomolecular recomienda en cada caso. Pero los avances que todos los días tienen lugar en el campo de la informática biomédica y la biomedicina, nos están permitiendo concretar un mayor número de casos de éxito, apelando a la psiquiatría de precisión.

De todas la variables implicadas en el proceso, hay algunas que usted o su ser querido pueden controlar. Me estoy refiriendo a las del tipo epigenético. Aún contando con la herramienta más poderosa de la minería de datos, si no cuento con su apoyo, de poco nos va a servir tanto modelo matemático y tanta labor científica dedicados al restablecimiento de su salud. Yo no tengo control sobre la cantidad de cigarros que fuma, el alcohol que ingiere, sus adicciones, sus hábitos alimenticios, la cantidad de azúcar que consume y de su estilo de vida en general. Usted sí que posee el control de todas esas variables epigenéticas.

Recuerde que para conseguir el éxito de un tratamiento, es indispensable hacer equipo, porque para ser honestos, los únicos que terminan siendo los protagonistas de los casos de éxito son ustedes, los familares y los pacientes mismos, no los terapeutas ni los expertos en minería de datos.

Un par de comentarios finales 

Si usted es psiquiatra y tiene un método de diagnóstico que supere al Bayes Net, por favor déjeme un comentario. Me muero por conocerlo (al método, no al psiquiatra).
Ahora que si usted es un paciente o un familiar de un chico o una chica aquejados de un trastorno de personalidad, entonces sí que me muero por responder a sus comentarios y ofrecerle todo mi apoyo hasta ver la luz al final del túnel, pues mi pasión consiste en hacer todo lo que esté a mi alcance para que su calidad de vida vuelva a ser la misma que prevalecía cuando su hijo(a) era lo que solía ser.

© Sergio López González. Fundación MicroMédix. 8 de diciembre de 2017


¿No encontraste aquí lo que buscabas? En el índice temático hay más artículos que te pueden interesar.


REFERENCIAS

[1] William J. Walsh. Nutrient Power. Heal your biochemistry and heal your brain. Skyhorse Publishing, 2012.
[2] Richard Stuckey,William Walsh & Brett Lambert. The Effectiveness of Targeted Nutrient Therapy in Treatment of Mental Illness. A pilot study. ACNEM Journal Vol 29 No 3 – November 2010.
[3] R.A.S Hemat. Principles of Orthomolecularism. Urotext. 2004
[4] Ian H. Witten, Eibe Frank & Mark A. Hall. Data Mining. Practical Machine Learning, tools and Techniques, third edition, Elsevier. 2011.
[5] Daniel T. Larose. Discovering Knowledge in Data. An introduction to data mining. John Wiley & Sons.2005
[6] David Nettleton. Análisis de Datos Comerciales. Díaz de Santos. 2003