Medicina Natural

Medicina Alternativa Personalizada. Consultorio

La informática biomédica en el diagnóstico y la prevención de la esquizofrenia y otros trastornos de la personalidad

9 comentarios

En esta entrega explico cómo es que las técnicas de la informática biomédica, consiguen que una máquina aprenda a diagnosticar y prevenir trastornos de la personalidad, apoyándose en la experiencia de los médicos. Un doctor en medicina aprende más de los casos que atiende y resuelve durante el ejercicio de su profesión, que de lo que sus maestros le enseñaron en la universidad. Emite sus diagnósticos basándose en sus casos de éxito, así como en los datos que le muestran los instrumentos que utiliza y en lo que develan las pruebas de laboratorio que recomienda efectuar, pero sobre todo, en los síntomas que le reportan sus pacientes.

La mayoría de los trastornos mentales suelen estar caracterizados por cierto número de síntomas y/o rasgos de personalidad, y parte de este trabajo ha consistido en asociar una variable a cada uno de esos rasgos. Los médicos acostumbran llamar síndrome a un complejo de síntomas, y lo que los especialistas en informática biomédica hemos logrado a lo largo de la presente investigación, ha sido clasificar cada variable (síntoma/rasgo) en su respectivo síndrome. No obstante, para estar en total consonancia con lo que los expertos en medicina ortomolecular establecen en relación a los grados de metilación [1], hemos preferido llamar fenotipo a cada síndrome. En este orden de ideas, vale decir que los fenotipos no son tipos de esquizofrenia, sino síndromes que trastornan de diferentes maneras, la conducta de un ser humano.

¿Pueden las máquinas aprender de la experiencia médica?

Al plantearles preguntas que se pueden contestar con un “sí” o con un “no”, el médico descubre ciertos patrones y una que otra relación entre los diferentes síntomas de sus pacientes. Cuando usted acude a la consulta, seguramente tendrá que responder a una serie de cuestionamientos del tipo: ¿le duele la cabeza?, ¿le zumban los oídos?, ¿se marea cuando se levanta de la cama?, ¿le arde al orinar?, ¿practica ejercicio?, ¿fuma?, ¿toma bebidas alcoholicas?, etc.
Una máquina puede aprovechar la experiencia de cientos de médicos para aprender también de los casos que ellos han resuelto en el pasado. Hoy, en plena era del conocimiento, uno puede ser testigo de cómo una computadora aprende a diagnosticar pacientes, a partir de miles de casos almacenados en un archivo clínico. Mientras mayor sea el número de registros en esa base de datos, mayor será la experiencia acumulada, más precisos serán los nuevos diagnósticos y menor el riesgo de desarrollar una enfermedad.
Al igual que el médico, el ingeniero en informática biomédica también dispone de herramientas, pruebas de laboratorio y cuestionarios para conseguir que sus pacientes restablezcan su salud, o mejor aún, para prevenirlos de una determinada enfermedad. Ya lo dice el adagio, “más vale prevenir que lamentar”.

Y aunque ese refrán contiene mucho de verdad, no parece haber permeado mucho en nuestra sociedad.
A juzgar por la cantidad de casos de esquizofrenia que hemos estado atendiendo de un tiempo para acá, la idea de que “eso es algo que a mi o a mi familia no nos puede pasar“, es la que hoy por hoy ha estado predominando y produciendo muchos sinsabores alrededor del mundo.  Como veremos a continuación, confiar en que esa aseveración es cierta es tanto como echar una moneda al aire y esperar ganar el volado. Si esa idea ha cruzado por su mente aunque sea una sola vez, y toca la casualidad de que es usted padre o madre de un adolescente, creo que lo mejor que puede hacer en este momento es seguir leyendo.

El diagnóstico preventivo: la clave para no enfermarse o evitar las recaídas 

En la imagen adjunta muestro una fracción del archivo de pacientes con trastornos de personalidad de la Fundación MicroMédix (pulse sobre la misma para agrandarla). Los 72 síntomas los consideramos nuestras variables de entrada, y la hoja de Excel que ahí aparece es de lo que se alimenta la herramienta que usamos para analizar los datos. La variable de salida es el fenotipo y  sus valores pueden ser cinco: histapenia, histadelia, piroluria, normal y otro. Los criterios para la asignación de dichos valores los establecimos de acuerdo con las especificaciones de los doctores Walsh, Stuckey y Lambert, para los grados de metilación y el extrés oxidativo de sus pacientes [1], [2] (véase también “Identificando el fenotipo de esquizofrenia: un paso más hacia la curación“).

Como cabría esperar, cada paciente presenta síntomas acorde con su individualidad bioquímica, y por lo tanto, con su epigenética. Así por ejemplo, el registro asociado al paciente con expediente No. 9 indica que éste ha sido diagnosticado con histapenia porque escucha voces, no sufre de ansiedad ni ataques de pánico, no es hiperactivo, manifiesta un interés excesivo en los asuntos religiosos (muy_devoto), no presenta síndrome de piernas inquietas, no reporta paranoia, tiene problemas de insomnio, padece acúfenos, y así continuaríamos interpretando los demás campos de este registro en particular, hasta llegar al atributo No. 72 del archivo. Es por esta razón que a los pacientes o a sus familiares les pedimos que contesten únicamente sí (S) o no (N), a las preguntas del cuestionario que hemos puesto aquí a su alcance para conocer sus síntomas.

Algunos de nuestros lectores, en especial los padres de hijos aquejados de algún trastorno de personalidad, ya se han dado cuenta de la importancia que tiene el responder al cuestionario con el tipo de preguntas que cité con anterioridad (S/N), pues desde que comenzamos a identificar los fenotipos de esquizofrenia por ejemplo, sus hijos han comenzado a responder mejor al tratamiento, como resultado del conocimiento adquirido al aplicar la técnica de la minería de datos a sus síntomas. Ya en otra parte de esta misma página web escribí: “el conocimiento que no se tiene, debe descubrirse“.

Al igual que la extracción de texto (text mining), la minería de datos (data mining) nos permite descubrir ese conocimiento que aparentemente no existe en un conjunto de datos como los de la hoja de cálculo que mostré con anterioridad.
Más adelante demostraré, cómo la aplicación de algunos algoritmos de la minería de datos a los síntomas de un paciente, nos está permitiendo diagnosticar su fenotipo, evitar que enferme, o prevenirlo de una recaída. Cada vez que predecimos el fenotipo que podría desarrollar un paciente, estamos mejorando la calidad de vida de una familia, pues solo así es posible administrar a tiempo, los nutrientes que la medicina ortomolecular recomienda justo para ese fenotipo. Es imperativo prevenir recaídas o evitar que un problema se complique, hasta el punto de tener que recurrir al confinamiento y la medicación psiquiátrica.

Un ejemplo sencillo de aprendizaje basado en casos 

El aprendizaje automático o de máquina emplea un algoritmo para clasificar, diagnosticar o predecir el resultado de una observación (caso) que se ve influenciado por el comportamiento de una o más variables predictoras (de entrada). Para entender mejor el concepto, explicaré su principio de funcionamiento con un ejemplo muy sencillo.
Durante algún tiempo, mi hermana solía preparar bacalao para agasajar a toda la familia en la cena del 24 de diciembre. En ciertas ocasiones el bacalao era todo un éxito, y en otras, en opinión de mi señor padre, no tanto.

Digamos que las variables de entrada eran solo tres (la verdad es que eran muchas más; pero como soy un lego en materia culinaria y en estos momentos no cuento con la asesoría de mi querida hermana, voy a simplificar las cosas): lugar en donde era adquirido el bacalao, tiempo de recalentado y tiempo de remojado previo.
Cuando el bacalao se compraba en “La Europea”, el éxito casi siempre estaba asegurado, excepto aquella vez que mi hermana lo recalentó por más tiempo del que era necesario, y se agrió.

Las veces que salía “sacatudo”, duro o salado (fracaso), era porque no se había puesto a remojar el tiempo suficiente. En fin, eran variables que influían sensiblemente en la variable a predecir: la opinión de mi papá sobre la calidad del bacalao en la cena de navidad.
Lo interesante de este ejemplo es analizar si Maricarmen descubrió un método para preparar el bacalao, basándose en lo que había ocurrido en las navidades anteriores. Y más interesante aún sería el poder predecir cuál será el resultado de esta navidad, tomando en cuenta que uno de mis sobrinos planea comprar el bacalao en el Mercado de San Juan y que va a darnos la sorpresa justo el 24 de diciembre.

Dado que Mari Carmen va a recibir el bacalao con tan poco tiempo de anticipación, lo más seguro es que no pueda dejarlo remojar lo suficiente. Estando así las cosas, ¿cuál podría ser la opinión de mi papá, sabiendo que el bacalao solo va a poderse remojar durante 6 horas?
Si pulsa usted sobre la imagen anterior para agrandarla, va a advertir que no existe un caso resgitrado en la base de datos, para el que la variable de entrada Lugar de compra sea igual a “Mercado de San Juan” y la variable Tiempo de remojado sea de 6 horas; en otras palabras, no existe un antecedente de lo que podría pasar, dadas estas condiciones. Sin embargo, la minería de datos podría ayudarnos a predecir si el bacalao va a ser un éxito o no esta navidad, con cierto nivel de precisión (probabilidad). ¿O podría usted intuitivamente darme un pronóstico con algún nivel de certidumbre?

La regla del ZeroR

Hay un método muy rudimentario que podríamos aplicar al ejemplo anterior. Consiste en analizar cuál es el resultado que más ocurrencias ha registrado y predecir de acuerdo con éste. En estadística, al valor que se repite con más frecuencia en un conjunto de datos se le llama moda. En la matriz de datos del ejemplo anterior, observamos que en la mayoría de los casos el bacalao ha sido un éxito. El éxito sería la moda en este caso, y espero quede claro que así ha sido en el  71.42% de las veces (100 x número de éxitos/total de observaciones = 100 x 5/7 %). Así, nuestro pronóstico sería que aunque el bacalao se quede remojando 6 horas, el resultado va a ser un éxito, con una margen de error del 28.58%.

En los ámbitos de la minería de datos y la estadística, al método que acabamos de emplear aquí para responder a la interrogante planteada al final del apartado anterior, se le conoce como regla del ZeroRy aunque simple en su naturaleza, nos sirvió mucho al momento de evaluar el método que seleccionamos para diagnosticar a nuestros pacientes. A continuación analizo las características de los métodos y herramientas que estuvimos evaluando en la Fundación MicroMédix, antes de seleccionar el algoritmo que a la postre nos proporcionó el mayor nivel de certidumbre, con miras a diagnosticar y prevenir trastornos de personalidad.

Métodos y herramientas para diagnosticar y prevenir la esquizofrenia y otros trastornos de la personalidad

Analicemos ahora el caso de un modelo para diagnosticar a un paciente, cuya madre nos ha escrito en busca de ayuda, pues su hijo padece de queratocono (por favor pulse en el vínculo que sigue si desea conocer los detalles de este trastorno y del caso completo de “Alejandro de Austria”). Para ello, les pedimos nos hicieran favor de responder el cuestionario de 72 preguntas, que estarán representando las variables de entrada de nuestro modelo de diagnóstico/prevención de fenotipo, tal y como lo describí en la sección “El diagnóstico preventivo: la clave para no enfermarse o evitar las recaídas”.

Cada variable (síntoma implícito en cada pregunta) únicamente puede asumir los valores S y N, dependiendo si la respuesta de esta admirable madre guerrera ha sido un sí o un no, respectivamente. Como se ve, ahora nuestro reto consiste en manejar 72 variables dicotómicas (S/N) y una variabe categórica de salida (las variables categóricas son aquellas que solo pueden adquirir valores que se pueden enumerar, y que por lo tanto no son continuas).
Antes de cargar los datos del paciente a nuestra base de datos, es necesario abrir primero este archivo con el software de minería de datos, y una vez seleccionado el modelo de diagnóstico, ingresar los síntomas que el paciente ha reportado, en un archivo de prueba (test). Nótese que no podemos (ni debemos) integrar los síntomas de un paciente a la base de datos, antes de ejecutar el algoritmo de diagnóstico, porque desconocemos su fenotipo. Esta es justamente la variable que pretendemos determinar con el software de minería de datos, y es por eso que a ésta se le llama variable de salida.

WEKA (Waikato Environment for Knowledge Analysis) es el software de minería de datos (derecha) que hemos estado usando desde hace años, con el fin de perfeccionar nuestras recetas, y fue desarrollado por la universidad de Waikato, Nueva Zelanda, en la modalidad de distribución gratuita (open source). Si pulsa usted sobre la captura de pantalla de la derecha, notará que WEKA  a empleado un diagrama de barras para representar el número de casos registrados para cada fenotipo. Hay 8 pacientes etiquetados con el fenotipo otro, 40 con histapenia (en rojo), 30 con histadelia (azul celeste), 2 normales (gris) y 20  diagnosticados con piroluria (en rosa).
Ahora que ya conoce usted el método del ZeroR, supongo que no tendrá problemas para emitir un diagnóstico aunque sea burdo del fenotipo de “Alejandro de Austria”. Aplicando el método que anteriormente expliqué “con manzanitas”… ¡ah perdón!, ¿fue con bacalao no es cierto? Bueno, acorde con la regla del ZeroR, un pronóstico no muy bueno sería el de histapenia, con un 40% de confianza (pulse sobre la imagen de la izquierda para ver lo que WEKA despliega al aplicar este método).

Dijimos que este valor corresponde a la moda de la variable fenotipo (en el sentido estadístico del término, no porque esté de moda hacerlo así), y aunque impreciso, nos servirá como referencia para evaluar el método que usaremos para emitir diagnósticos más serios y predicciones más certeras. Porque imagínese nada más, querido lector, cómo confiar en un diagnóstico cuyo margen de error es del 60%. Note y anote los valores del coeficiente Kappa de Cohen y el de la raíz del error cuadrático medio porque son factores que nos indican qué tanto nos estamos equivocando en los diagnósticos.

Como por el momento no se trata de impartir un curso de informática biomédica o de estadística, sino únicamente saber para qué nos van a servir ambos parámetros, baste decir que entre más cerca esté de la unidad el coeficiente de Kappa, más preciso será el modelo seleccionado, y que entre más pequeña sea la raíz del error cuadrático medio, menos errores estaremos cometiendo y mejor será el modelo objeto de análisis.
Un criterio de seleción basado en la regla del ZeroR es completamente inadmisible, aunque en honor a la verdad, sé de algunos psiquiatras con criterios de diagnóstico peores, pues en lo único que se basan es en su “Manual Diagnóstico y Estadístico de los Trastornos Mentales (DSM)”, o a veces ni siquiera en eso. Estimado lector, permítame informarle que ese manual no contiene absolutamente nada de estadística. Si hay algo estadístico y dotado de inteligencia que sí nos puede ayudar a diagnosticar con bastante precisión a nuestros pacientes, son sin duda alguna los árboles de decisión, las redes bayesianas y las redes neuronales artificiales.

Árboles de decisión y selección de atributos

Si un modelo con 3 variables de entrada y una de salida ocasiona cierta incertidumbre a la hora de pronosticar cómo va a estar el bacalao esta navidad, imagínese lo que implica uno con 72 variables de entrada que pretende diagnosticar o predecir el fenotipo de un paciente. Las cosas pueden complicarse sobremanera. Y aunque la máquina sea la que se va encargar de ejecutar los algoritmos, el reducir el número de variables de entrada no solo simpifica los cálculos y el análisis de los datos, sino que podría aumentar el nivel de precisión del modelo. En seguida le explico qué fue lo que hice para reducir el modelo inicial de 72 variables de entrada, a uno de 35 atributos, aumentando al mismo tiempo el nivel de precisión de los diagnósticos y las predicciones.

Después de haber abierto con WEKA el archivo de pacientes, pulsé en la pestaña Classify para acceder a la función de clasificación de instancias (casos), y luego seleccioné el algoritmo J48, dentro de la categoría correspondiente a los árboles de decisión. Al dar clic en el botón de arranque (Start), lo que obtuve fue un coeficiente de Kappa de 0.605, una raíz del error cuadrático medio de 0.3174 y un nivel de precisión del 72%. (pulse usted sobre la imagen que aparece a su izquierda para ver los detalles). Esta precisión, si bien ha resultado muy superior a la que nos ofrece la regla del ZeroR, no es precisamente lo que una madre guerrera estaría esperando para optimizar la receta de su hijo.

Pero entonces, ¿para qué seleccionar un método que se está equivocando el 28% de las veces?
Mi intención al seleccionar el método del árbol de decisión J48, además de comparar su precisión con la del ZeroR, era analizar los síntomas que seleccionaría este algoritmo.

Los árboles de decisión nos ahorran el trabajo de seleccionar los atributos más relevantes, de entre todos los datos del conjunto (en este caso los síntomas del paciente). Y lo que llama más la atención es que lo hacen de manera automática. Uno no tiene que ir a la pestaña Select attributes de WEKA para seleccionar un evaluador de atributos y luego probar con más de una estrategia de búsqueda, a fin de intentar aumentar la precisión del modelo. Se requiere conocer bien el tema para obtener un buen resultado, haciéndolo explícitamente.
Tratando de ahorrarme el trabajo de ahondar en el tema (lo cual, como veremos más adelante terminé haciéndolo de todas maneras), quise saber lo que harían WEKA y el árbol J48 al pedirles que me mostraran el diagrama que “tenían en mente”.

La inteligencia de estas herramientas es tal, que nos permiten ver cosas que no podríamos descubrir por nosotros mismos. ¿O sabe usted de algún psiquiatra que le pueda decir cuál de todos los síntomas de la esquizorenia influye más en sus diagnósticos? Quiero pensar que se inclinaría por la escucha de voces, las alucinaciones visuales, las obsesiones o las compulsiones.

Pero lo que importa aquí no es lo que tenga que opinar un psiquiatra al respecto, sino lo que WEKA y el J48 puedan develar en el proceso. Estos dos aliados nos están diciendo que hay un 72% de probabilidades de que los problemas psicogénicos de la población de pacientes de nuestra base de datos, podrían estar relacionados con el hecho de tener canas prematuras (fíjese en el nodo raíz del árbol que aparecerá en su pantalla, después de pulsar sobre la imagen adjunta). Ya lo estoy oyendo decir: ¡con el encanecimiento prematuro! Sí querido lector, leyó usted bien. Y tiene mucho más sentido cuando uno va y busca en Google, las causas más importantes del encanecimiento prematuro.

Si usted indaga lo suficiente sobre esta cuestión, lo que va encontrar en la mayoría de los sitios web, es que las canas prematuras son un claro indicio de deficiencia de vitaminas, minerales y sobre todo de melanina. Hay muchas evidencias de que las canas aparecen antes de lo normal, cuando uno está sujeto a un estrés constante. Los editores de la revista Scientific American lo han dejado muy claro: el estrés provoca que nuestro cabello se tiña de gris, y en casos extremos, de blanco.

En este mismo diagrama de árbol se puede ver cómo éste método dignostica a un paciente, a partir de las decisiones que va tomando a lo largo de las ramas que conducen a las hojas etiquetadas como histapenia, histadelia, piroluria y otro. Las hojas del árbol son los nodos terminales. Para ejemplifiar como funciona este método de extracción de datos (data mining), siga la rama que marqué con rojo, en el siguiente orden:

1. El algoritmo comprueba que el paciente ha contestado que NO a la pregunta ¿tiene canas prematuras (variable de mayor relevancia según este método)?, por lo que decide ir a verificar la respuesta al nodo etiquetado como obsesivo-compulsivo (siguiente variable de importancia de acuerdo con este método).
2. Ahí comprueba que NO es obsesivo-compulsivo y continúa con la pregunta 3:
3. ¿Rasgos faciales delicados? Como la respuesta aquí es afirmativa, va en busca del nodo mal_genio.
4. Puesto que en este último nodo la respuesta es , J48 concluye que se trata de una piroluria (en la hoja de esta “rama roja” del árbol).

A pesar de toda esa inteligencia, una precisión del 72 % no garantiza el éxito de un tratamiento, por lo que es imprescindible buscar un modelo que nos ofrezca al menos un 90% de confianza.
Pensando que los atributos que había seleccionado el árbol J48 me servirían como entrada para otro método de árbol, o bien para una red bayesiana, probé con los árboles LMT y Random Forest, así como con un par de algoritmos bayesianos. Aún así, los resultados todavía dejaban mucho que desear.
Así las cosas, había que seleccionar los atributos más significativos de manera explícita, con los medios que ofrece WEKA.
Una vez que supe cuál sería una buena estrategia para la selección de atributos, decidí probar con el evaluador por omisión (CfsSubsetEval) y el método de búsqueda Best First. El resultado de esta fase del proyecto aparece en la captura de pantalla que se muestra a la izquierda. Como se ve, esta vez son 35 los atributos que de acuerdo con este último hallazgo, debería yo emplear de aquí en adelante como variables de entrada en mis evaluaciones.   En la imagen de la derecha se puede apreciar cómo se distribuye la variable escucha_voces en función del fenotipo, después de haberla seleccionado en la interfaz de pre-procesamiento. De todos los pacientes, hay 53 que no escuchan voces y 47 que sí lo hacen. Se observa también que los pacientes que han sido diagnosticados con histapenia, son los que más escuchan voces (área en rojo).

Pero más que estar buscando un método que mejore los diagnósticos, lo que más nos importa en la Fundación MicroMédix, es evaluar qué tanto un adolescente podría estar en riesgo de desarrollar un problema psicogénico, caracterizado por cualquiera de los fenotipos que aquí hemos estado analizando. Nos interesa por ejemplo encontrar un modelo de diagnóstico que nos permita responder a preguntas del tipo: ¿qué tan probable es que un muchacho se empiece a aislar de sus amigos y familiares, habiendo sido diagnosticado con histadelia? Una posibilidad es recurrir a los métodos dotados de inteligencia artificial, entre los que destacan las redes bayesianas. A continuación exploramos esa posibilidad.

El método de red bayesiana que hizo posible aumentar la precisión hasta en un 92%

Provisto de un conjunto de atributos optimizado, me di a la tarea de probar varios métodos, tanto de árboles de decisión como de redes bayesianas. Fue así como obtuve los mejores resultados.

A lo largo de este proceso de búsqueda, advertí que efectivamente los atributos que habia seleccionado de manera explícita, habían producido un aumento en las precisiones tanto en uno de los tres árboles de clasificación, como en los dos métodos bayesianos que elegí. Excepto para los casos de los árboles de decisión J48 y LMT, los demás métodos superaron a sus antecesores. En el caso del Random Forest la precisión llegó a ser del 90%. En la tabla adjunta muestro el resumen de las pruebas que tuve que realizar para finalmente adoptar como modelo de diagnóstico el de Bayes Net, no solo por haberme entregado la mejor precisión (del 92%), sino los mejores coeficientes estadísticos.

¿Recuerda lo que le comenté sobre los parámetros Kappa de Cohen y de la raíz del error cuadrático medio? Bueno, pues fue así como supe cuál era el mejor de los seis métodos analizados. El modelo a emplear terminó siendo el método de Bayes Net aplicado a las 35 variables que de acuerdo con WEKA, resultaron ser las más relevantes.

Con este modelo ya podemos responder a ese tipo de preguntas que nos permiten evaluar el riesgo que tiene una persona de enfermar. Con la inteligencia artificial de un método como el de Bayes Net, podemos determinar qué probabilidades tiene un paciente de padecer un síntoma, dado su fenotipo. En la imagen adjunta por ejemplo (pulse para agrandarla), se pueden conocer las probabilidades que tendría un adolescente de escuchar voces, de experimentar delirios, de no recordar sus sueños y de aislarse de sus familiares y amigos, dependiendo todo ello de su fenotipo. Así, de haber sido diagnosticado con histapenia, dichas probabilidades serían del 74.4%, 59.8%, 30.5% y 54.9%, respectivamente.

Uno de los principales objetivos al desarrollar un sistema de esta naturaleza, es evitar que los síntomas asociados a cualquiera de los fenotipos mencionados, hagan su triunfal aparición. Sin embargo, no hay que perder de vista que estamos ante un modelo probabilístico, y hay que ser my cautelosos a la hora de interpretar los resultados. Note por ejemplo que en la tabla de distribución de probabilidades de la figura anterior, se establece que la probabilidad de que un paciente normal escuche voces no es nula, lo cual no significa que esté en riesgo, sino simplemente que el modelo no es determinístico y que existe por lo tanto, un margen de error del 8%. No está nada mal.

Diagnosticando a un paciente con queratocono: ¿un fenotipo que podría clasificarse como “otro”?

Regresando al caso de “Alejandro de Austria”, es menester aplicar todo el conocimiento adquirido hasta aquí, para determinar con una precisión del 92%, el fenotipo de nuestro querido amigo.
El objetivo es tener una idea más clara de cuál puede ser este fenotipo, a fin de perfeccionar su receta.
En la captura de pantalla adjunta, estoy mostrando el diagnóstico que WEKA me entregó, al ingresar las respuestas que la mamá de este chico anotó en el cuestionario para identificar su fenotipo. En el conjunto de datos de prueba (test set), incluí a otros seis pacientes que estaban esperando su diagnóstico (pulse sobre la imagen para ver los detalles).

De acuerdo con lo que hasta hora sabemos sobre Alejandro, mi expectativa era que el resultado fuera fenotipo=”otro”; pero lo que el programa de minería de datos me entregó con una certidumbre del 99.2% fue “histapenia”, según se ve en el informe de la imagen anterior (inst# 7). A reserva de lo que revelen las pruebas de laboratorio a realizar en este caso, le estaremos enviando a este madre guerrera, una receta que tome en cuenta tanto el diagnóstico aquí obtenido, como los resultados de dichos análisis.

Obsérvese que en esa misma imagen hay dos pacientes que el modelo diagnosticó con histadelia. En el caso número 3 sin embargo (inst# 3), el programa no parace estar muy seguro de ese diagnóstico y por ende, nosotros tampoco. La certidumbre en este caso ha sido del 47.1%. Al revisar el registro de los datos de este paciente caí en la cuenta de que había dejado muchas preguntas sin contestar, y de alguna manera Bayes Net no se quiso comprometer. Asimismo, quise ponerlo a prueba ingresando un registro de un paciente que ya estaba dado de alta en la base de datos. Si Bayes Net hablara (poco le falta) me hubiera dicho: “a este señor ya lo conozco, es el que se subió a la rama roja de tu árbol J48, y te garantizo (100%) que es pirolúrico”. Nada más faltó que después de haberle borrado la variable que contenía la edad de los pacientes, me dijera que no se tratataba de un adolescente, sino de un “baby boomer”.

Conclusiones

La esquizofrenia, el trastorno bipolar, el autismo, la ansiedad, la depresión, los ataques de pánico y demás trastornos de la personalidad, son enfermedades multivariables, pues son demasiados síntomas los que entran en  juego a la hora de diagnosticar y prescribir. No es fácil determinar cuánto va a durar un tratamiento, ni qué tan bien va a responder un paciente a los suplementos que la medicina ortomolecular recomienda en cada caso. Pero los avances que todos los días tienen lugar en el campo de la informática biomédica y la biomedicina, nos están permitiendo concretar un mayor número de casos de éxito.

De todas la variables implicadas en el proceso, hay algunas que usted o su ser querido pueden controlar. Me estoy refiriendo a las del tipo epigenético. Aún contando con la herramienta más poderosa de la minería de datos, si no cuento con su apoyo, de poco nos va a servir tanto modelo matemático y tanta labor científica dedicados al restablecimiento de su salud. Yo no tengo control sobre la cantidad de cigarros que fuma, el alcohol que ingiere, sus adicciones, sus hábitos alimenticios, la cantidad de azúcar que consume y de su estilo de vida en general. Usted sí que posee el control de todas esas variables epigenéticas.

Recuerde que para conseguir el éxito de un tratamiento, es indispensable hacer equipo, porque para ser honestos, los únicos que terminan siendo los protagonistas de los casos de éxito son ustedes, los familares y los pacientes mismos, no los terapeutas ni los expertos en minería de datos.

Un par de comentarios finales 

Si usted es psiquiatra y tiene un método de diagnóstico que supere al Bayes Net, por favor déjeme un comentario. Me muero por conocerlo (al método, no al psiquiatra).
Ahora que si usted es un paciente o un familiar de un chico o una chica aquejados de un trastorno de personalidad, entonces sí que me muero por responder a sus comentarios y ofrecerle todo mi apoyo hasta ver la luz al final del túnel, pues mi pasión consiste en hacer todo lo que esté a mi alcance para que su calidad de vida vuelva a ser la misma que prevalecía cuando su hijo(a) era lo que solía ser.

© Sergio López González. Fundación MicroMédix. 8 de diciembre de 2017


¿No encontraste aquí lo que buscabas? En el índice temático hay más artículos que te pueden interesar.


REFERENCIAS

[1] William J. Walsh. Nutrient Power. Heal your biochemistry and heal your brain. Skyhorse Publishing, 2012.
[2] Richard Stuckey,William Walsh & Brett Lambert. The Effectiveness of Targeted Nutrient Therapy in Treatment of Mental Illness. A pilot study. ACNEM Journal Vol 29 No 3 – November 2010.
[3] R.A.S Hemat. Principles of Orthomolecularism. Urotext. 2004
[4] Ian H. Witten, Eibe Frank & Mark A. Hall. Data Mining. Practical Machine Learning, tools and Techniques, third edition, Elsevier. 2011.
[5] Daniel T. Larose. Discovering Knowledge in Data. An introduction to data mining. John Wiley & Sons.2005
[6] David Nettleton. Análisis de Datos Comerciales. Díaz de Santos. 2003

Anuncios

Autor: micromedix

Sergio López González. Ing. en Informática Biomédica

9 pensamientos en “La informática biomédica en el diagnóstico y la prevención de la esquizofrenia y otros trastornos de la personalidad

  1. Cada entrada es mas profunda en la investigacion, de gran ayuda para todos a los que nos interesa este tema, felicitaciones.

    Me gusta

    • Muchas gracias Jorge por tus alentadoras palabras. Me alegra que te guste nuestro trabajo.
      Un placer saludarte de nuevo.

      Me gusta

      • Buenos dias Sergio, Tal como le comente en correo anterior sobre la evolucion de nuestra hija creo que una parte muy importante ha sido ajustar su dieta, adicional a su actividad fisica y la terapia CBT. En relacion a la primera adjunto informacion de este tema por si pudiera ser de utilidad en sus investigaciones sobre el tema de cerrar el circulo a la esquizofrenia, el tema de las alergias cerebrales para nuestro caso se ajusta muy bien a todo lo que ha vivido nuestra hija, El libro de W. Philpot y D. Kalita nos ha dado el plan a seguir en relacion a la dieta de rotacion de alimentos( que gran trabajo de toda una vida, como el de todos estos personajes que hemos tenido la fortuna de conocer a travez de sus investicaciones), el trabajo de R.Jaffe y O. Kreusi permite entender la importancia de la psiquiatria integrativa en los areas de inmunologia, endocrinologia y neurologia cosa muy dificil de aplicar por los profecionales tradicionales de la Psiquiatria, ellos no son culpables, fueron educados de una manera reduccionista, su culpa si hay alguna es no querer cambiar ante la evidencia. El inicio de el proceso integrativo solo en su inicio ya presenta un serio problema en su aplicacion : los examines de laboratorio ya que el sistema de servicios medicos restringe la realizacion de examenes que no sean los basicos de precios bajos por su volumen. El examen de Histamina en sangre completa como tal no hemos logrado realizarlo a la fecha, no esta dentro de la relacion de los autorizados, solo el de histamina liberada en plasma que no es lo mismo, pero siendo esta Histamina el 2% de la de sangre total hemos encontrado que la histamina de nuestra hija calcuada resulta en 15 ng/ml mucho menor de 40 indicando un biotipo de histapenia, los resultados del cobre y seruplasmina en suero resultan bajos, sin embargo la mineralogia de cabello indica cobre alto en tejidos confirmando el biotipo de histapenia de Pfeiffer. De aqui en adelante la suplementacion nutricional la hemos tomado de acuerdo a este biotipo en cojunto con la dieta y control de otros posible elementos de stress, obteniendo los siguientes resultado a la fecha: reduccion del coctel de antisicoticos que tomaba, actualmente toma solo 7.5 mg Aripripazole, y 50 mg Clozapina solo como efecto psicologico( esta dosis hace reir a los Psiquiatras) de que esta tomando algo de farmacos. En alguna oportunidades de cambio la Clozapina por una pastilla de Biopiperina bastante parecida en color y tamano con igual resultado. Reversion de su condicion de prediabetica ( resultados de examines en normal). Reduccion de dosis de Sintroid por parte del endocrinologo, por resultados de examenes(este es otro tema de bastante controversia con los endocrinologos, la mayoria se educo para tratar igual todos los casos de tiroides). Reversion del sindrome metabolico, su peso en dos anos paso de 78 Kg a 55 kg su peso normal para su altura y que tenia antes de su primer incidente psicotico. Reversion de condicion de sindrome higado graso, la ultima ecografia casi no la cree el radiologo( este tema es serio ya que los medicos consideran que no es grave y no advierten de su evolucion es a la cirrosis hepatica, que solo puede evitarla nada mas y nada menos que el transplante de higado, este caso lo vivio recientemente aunque no lo creas un medico amigo muy apreciado). Eliminacion de temblores en manos y a veces posiciones corporales catatonicas( creo que de nombre florido Diskinesia Tardativa, bendito manganeso). Eliminacion de la constipacion severa, que la mantenia intoxicada con todas sus consecuencias. Otros libros tambien no menos importantes en estos temas que utilizamos, N. Campbell-McBride, Gut and Psychology Syndrome, E. Edelman, Natural Healing for Schizophrenia, en mi opinion este es un fantastico compendio del trabajo de C. K. Pfeiffer, en The schizophrenias our to Conquer ya que incluye referencias especificas, examenes a realizar segun cada biotipo y sobre todo las condiciones de salud relacionadas a tratar fin tener un mejor resultado en el tratamiento. Adjunto examenes de nuestra hija fin te sirvas revisarlos y darme tu opinion sobre ajustes a nuestro tratamiento. La proxima semana a nuestro regreso a casa estare enviandote la donacion de acuerdo a las instrucciones de tu pagina. Gracias anticipadas nuevamente por tus opiniones. Jorge Gomez Perez

        Me gusta

      • Muy buenas tardes Jorge:
        Como le comenté en mi respuesta a su correo, me parece que va por buen camino, y creo que sería conveniente que nos hiciera favor de responder el cuestionario que hemos puesto a su disposición en este espacio, a efecto de identificar o tal vez confirmar el fenotipo que está usted suponiendo corresponde al de su hija (histapenia). Le recomiendo que me lo envíe junto con las pruebas de laboratorio que menciona, antes de la consulta, a fin de aprovechar mejor el tiempo de la misma.
        Un abrazo.

        Me gusta

      • Estimado Jorge:
        Este medio no es el apropiado para que adjuntes tus archivos, ten la amabilidad de enviarlos vía un mensaje de correo electrónico. Ninguno de los archivos que has intentado adjuntar me ha llegado. El mensaje anterior lo tuve que borrar porque era inteligible en su mayor parte. Por favor envía texto únicamente.
        Muchas gracias por tu comprensión.

        Me gusta

  2. Hola Sergio,

    Muchas felicidades por el nuevo método de investigación biomédica incorporado. Ya de por sí el text mining es una gran herramienta, y ahora con el data mining, podríamos decir que, si de por sí cada uno es de gran poder, “juntos son dinamita”.

    No sé si pueda aplicar el data mining a lo que yo hago, pues lo he estado pensando y de momento no veo cómo, por el tipo de información que manejo, pero de cualquier manera me ha interesado mucho el programa WEKA y me puse a pensar que debe haber un sinfín de aplicaciones prácticas. Simplemente, se me ha ocurrido que se podría usar para determinar los factores que aumentan o disminuyen la criminalidad de una urbe, y al aplicarse sistemáticamente las herramientas, se podrían salvar vidas y elevar la calidad de vida de la sociedad en general. ¡Realmente muchas cosas se podrían hacer! Me has abierto los ojos a este mundo que había yo estudiado en cierta medida pero hacía tiempo no lo veía.

    Por otro lado, en este artículo hay algo que no logro bien comprender, posiblemente porque no tengo tu modelo totalmente claro. A continuación te expongo mi duda.

    En este artículo mencionas que:

    1. “Los médicos acostumbran llamar síndrome a un complejo de síntomas”
    2. “hemos preferido llamar fenotipo a cada síndrome”

    A partir de esto, entiendo que el fenotipo es un complejo o conjunto de síntomas.

    Pero luego dices:

    “Con la inteligencia artificial de un método como el de Bayes Net, podemos determinar qué probabilidades tiene un paciente de padecer un síntoma, dado su fenotipo.”

    Mas si el conjunto de síntomas es lo que constituye el fenotipo, ¿cómo es que de aquí puedo determinar qué probabilidades tiene de padecer un síntoma, si este síntoma es parte de la definición del fenotipo, y no una inferencia a posteriori? De hecho, en el cuestionario hay preguntas como si escucha voces, y las preguntas contienen todos (o casi todos) los posibles síntomas de la enfermedad, que deben ser contestados. Esto es lo que no entiendo bien; visto así, tal pareciera que lo que debe ser inferido por el data mining es ya parte de la definición del fenotipo.

    From

    Me gusta

    • Mi querido Richard.
      Me encantó tu comentario porque enriquece mucho el mensaje que quiero transmir a través de este espacio. De hecho, esa misma duda me surgió a mi también mientras interpretaba los resultados del método de Bayes Net, porque tienes razón, si el fenotipo es en sí la variable que estamos prediciendo, cómo es que la probabilidad de una varbale predictora pueda estimarse, una vez determinado el fenotipo. Como yo lo veo, es la forma en la que opera el teorma de Bayes, que es en el que está basado este algoritmo; pero para no entrar en detalles matemáticos (en caso de que los quieras conocer, te los puedo enviar por email), una manera de entender la relación inversa que hay entre una variable predictora y la de salida, es concebir el peso que cada una de las variables predictoras tiene, al momento de definir la de salida (en este caso el fenotipo). Así por ejemplo, en las tablas de distribución de probabilidades, si una variable acusa una probabilidad mayor que otra, eso indica que tuvo mayor influencia en la definición del fenotipo (su contribución fue mayor), como sucedió en el caso de la escucha de voces en la histapenia y el aislamiento social en la histadelia (pulsa sobre la imagen de las tablas para agrandarla y luego agrándala más con el navegador, para que puedas ver bien el detalle).
      Esa relevancia de las variables predictoras se puede observar mejor en el diagrama de árbol del método J48, pues es más intuitivo que en el de Bayes Net. Ahí, se hace más evidente la influencia que tiene la variable (rasgo) canas_prematuras no solo en un fenotipo, sino en varios de ellos. Sería interesante analizar la tabla de distribución de probabilidades para las canas_prematuras, para ver qué tanto influye en la determinación de los fenotipos, al estar empleando Bayes Net. Creo que lo voy a hacer para ver si coincide con lo que arrojó el método J48.
      Espero haber aclarado tu duda.
      Te mando un cariñoso abrazo.

      Me gusta

      • Hola Sergio, muchas gracias por tu respuesta. Tú verás, pero creo que ya lo entendí mejor. Pienso que con lo que dices de los pesos de las variables y además lo que dices sobre prevención, se puede ver que los síntomas que un paciente reporta no constituyen el fenotipo mismo; son tan sólo sus síntomas presentes. A partir del algoritmo entonces, considerando los síntomas actuales y su peso, podemos saber cuáles de sus síntomas son los “focos rojos,” por así decirlo, y además, dependiendo del diagnóstico, incluso si no presenta algún síntoma, como la escucha voces, podría padecerlo en el futuro, si el fenotipo así lo predice. Visto así, el fenotipo no es ya meramente un conjunto de síntomas, sino lo que parecía ser desde un principio: la condición que subyace a esos síntomas, misma que no podemos conocer de lleno (no se tiene actualmente el avance en medicina para entenderla totalmente), pero sí podemos ver su aspecto externo en los síntomas que la delatan.

        Te mando un abrazo igualmente.

        Me gusta

      • Y si tanto tú como William Walsh están en lo correcto, entonces eso que dices que subyace a los síntomas, es justamente el grado de metilación. Y de acuerdo con lo que nos han estado reportando los pacientes, todo parece indicar que efectivamente así es.
        Feliz año 2018

        Me gusta

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión /  Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión /  Cambiar )

Conectando a %s