En Scalian somos expertos en toda la cadena de inteligencia de negocio y en la transformación de los procesos de rendimiento financiero en la empresa. Somos una compañía internacional especializada en soluciones para empresas que buscan realizar su transformación digital mediante la implementación de proyectos de big data, cloud, ciberseguridad o IA.
Varias enfermedades del sistema respiratorio pueden diagnosticarse mediante el análisis visual de las imágenes de radiografía de tórax (RX). En este artículo, ilustraremos cómo una pipeline de modelos de aprendizaje profundo ayudó a los médicos a interpretar la CXR y dirigir su atención a las partes más significativas de la imagen. El artículo no pretende ser un blog técnico, está orientado a dar una visión integral de Dataiku. Por lo tanto, está dirigido a gerentes de empresas o personas que quieran conocer las características de Dataiku que intervienen en un caso de uso de este tipo.
Aunque sólo mostraremos la clasificación entre tres clases: neumonía intersticial, otra patología y sin patología, es posible especificar más la enfermedad más probable entre otras 15 categorías que se agruparon en la clase «otra patología». Para más detalles, consulte Cohen et al.
Debido a la crisis sanitaria mundial, la detección de la neumonía intersticial era especialmente relevante, ya que es una de las principales enfermedades causadas por el virus COVID-19. Nuestro objetivo final es desarrollar una herramienta de apoyo a la toma de decisiones para los radiólogos que nos permita recopilar información sobre los resultados del modelo a través de la validación por parte de los médicos. De este modo, podremos seguir mejorando los resultados del modelo y hacerlo más preciso.
Conjunto de imágenes de rayos X.
Como en cualquier otro proyecto de aprendizaje automático (ML), empezamos por asegurarnos de que no nos afectaba el problema del Garbage In, Garbage Out (GIGO). Tras algunas reuniones con los médicos para entender sus necesidades y considerar nuestras alternativas, decidimos entrenar los modelos con imágenes de RX frontal:

Por desgracia, incluso con los mejores recursos y colaboradores, las imágenes no siempre están correctamente etiquetadas, pueden proceder de diferentes máquinas de rayos X o estar tomadas en posiciones distintas. No podíamos correr el riesgo de probar y evaluar una entrada errónea, sobre todo teniendo en cuenta la complejidad y la importancia de detectar anomalías en las imágenes médicas. Para saber más sobre cómo se puede utilizar un marco de etiquetado de aprendizaje activo para ayudar en la obtención de imágenes biomédicas, consulte este ebook de Dataiku.
Por lo tanto, decidimos comenzar la línea de modelos con un discriminador de imágenes basado en una red generativa adversarial (GAN) y un discriminador de rayos X lateral/frontal más específico.
El Discriminador
¿Por qué utilizar un discriminador de imágenes? Esto evitará que el modelo aprenda de imágenes que no tienen nada que ver con los datos de entrenamiento. Se asegura de que todas las imágenes no sólo pertenecen a la misma distribución, sino que también están en la orientación correcta.
La segmentación de imágenes biomédicas
Bien, ahora estamos tratando con radiografías frontales… pero pueden no haber sido tomadas por la misma persona, la misma máquina, o puede haber diferencias significativas en el tamaño del pecho de los pacientes. Queremos que nuestro modelo sólo se fije en las características del área pulmonar.
Para ello, desarrollamos un modelo U-Net. La arquitectura U-Net se construye utilizando la red totalmente convolucional y está diseñada de forma que proporciona mejores resultados de segmentación en imágenes médicas. Fue diseñada por primera vez por Olaf Ronneberger, Philipp Fischer y Thomas Brox en 2015 para procesar imágenes biomédicas.

Entonces, doctor, ¿Cuál parece ser el problema?
Las imágenes de CXR centradas en el pulmón pueden entonces pasar por un modelo de aprendizaje profundo basado en una estructura DenseNet. Tomando la capa convolucional más significativa y procesándola en un mapa de calor se obtienen los píxeles de la imagen a los que el médico debe prestar atención. Hay que tener en cuenta que el médico siempre tiene la última palabra y que estos resultados solo sirven para ayudarle a decidir un diagnóstico.

La aplicación web de Dataiku permite que el modelo reciba comentarios
Gracias a la funcionalidad integrada de Dataiku para desplegar webapps, desarrollamos una aplicación de apoyo a la toma de decisiones para médicos. Los médicos podían dar retroalimentación al modelo al diagnosticar la imagen. La información se almacenaba para seguir aprendiendo de los comentarios de los expertos. La predicción del modelo, junto con la experiencia y los conocimientos del médico, hizo que la predicción global de la tarea se acercara al error de Bayes. Este proyecto es un ejemplo de cómo el ML puede ayudar a los humanos a rendir mejor cuando se trata de una tarea muy compleja.

Gracias al desarrollo de este proyecto, hemos podido aplicar técnicas similares a otros problemas. El más parecido, con el mismo tipo de imágenes, es la predicción de la edad ósea, donde el flujo es prácticamente el mismo. Otros proyectos realizados con imágenes médicas con Dataiku han sido la detección de cáncer de piel para dermatología, cáncer de mama, o el análisis de resonancias magnéticas de rodilla y próstata.
Dataiku nos ha permitido crear aplicaciones web de apoyo a la toma de decisiones para los médicos, además de recoger información sobre los resultados de los modelos, de forma que es posible mejorar aún más su rendimiento. Las aplicaciones web permiten a los médicos aplicar los modelos a imágenes concretas para obtener un resultado en poco tiempo. Estas aplicaciones permiten recoger información sobre estos resultados.