Skip to content

Clasificación de enfermedades en radiografías de tórax con Deep Learning y Dataiku

En Scalian somos expertos en toda la cadena de inteligencia de negocio y en la transformación de los procesos de rendimiento financiero en la empresa. Somos una compañía internacional especializada en soluciones para empresas que buscan realizar su transformación digital mediante la implementación de proyectos de big data, cloud, ciberseguridad o IA.

Varias enfermedades del sistema respiratorio pueden diagnosticarse mediante el análisis visual de las imágenes de radiografía de tórax (RX). En este artículo, ilustraremos cómo una pipeline de modelos de aprendizaje profundo ayudó a los médicos a interpretar la CXR y dirigir su atención a las partes más significativas de la imagen. El artículo no pretende ser un blog técnico, está orientado a dar una visión integral de Dataiku. Por lo tanto, está dirigido a gerentes de empresas o personas que quieran conocer las características de Dataiku que intervienen en un caso de uso de este tipo.

Aunque sólo mostraremos la clasificación entre tres clases: neumonía intersticial, otra patología y sin patología, es posible especificar más la enfermedad más probable entre otras 15 categorías que se agruparon en la clase «otra patología». Para más detalles, consulte Cohen et al.

Debido a la crisis sanitaria mundial, la detección de la neumonía intersticial era especialmente relevante, ya que es una de las principales enfermedades causadas por el virus COVID-19. Nuestro objetivo final es desarrollar una herramienta de apoyo a la toma de decisiones para los radiólogos que nos permita recopilar información sobre los resultados del modelo a través de la validación por parte de los médicos. De este modo, podremos seguir mejorando los resultados del modelo y hacerlo más preciso.

Conjunto de imágenes de rayos X.

Como en cualquier otro proyecto de aprendizaje automático (ML), empezamos por asegurarnos de que no nos afectaba el problema del Garbage In, Garbage Out (GIGO). Tras algunas reuniones con los médicos para entender sus necesidades y considerar nuestras alternativas, decidimos entrenar los modelos con imágenes de RX frontal:

Por desgracia, incluso con los mejores recursos y colaboradores, las imágenes no siempre están correctamente etiquetadas, pueden proceder de diferentes máquinas de rayos X o estar tomadas en posiciones distintas. No podíamos correr el riesgo de probar y evaluar una entrada errónea, sobre todo teniendo en cuenta la complejidad y la importancia de detectar anomalías en las imágenes médicas. Para saber más sobre cómo se puede utilizar un marco de etiquetado de aprendizaje activo para ayudar en la obtención de imágenes biomédicas, consulte este ebook de Dataiku.

Por lo tanto, decidimos comenzar la línea de modelos con un discriminador de imágenes basado en una red generativa adversarial (GAN) y un discriminador de rayos X lateral/frontal más específico.

El Discriminador

¿Por qué utilizar un discriminador de imágenes? Esto evitará que el modelo aprenda de imágenes que no tienen nada que ver con los datos de entrenamiento. Se asegura de que todas las imágenes no sólo pertenecen a la misma distribución, sino que también están en la orientación correcta.

La segmentación de imágenes biomédicas

Bien, ahora estamos tratando con radiografías frontales… pero pueden no haber sido tomadas por la misma persona, la misma máquina, o puede haber diferencias significativas en el tamaño del pecho de los pacientes. Queremos que nuestro modelo sólo se fije en las características del área pulmonar.

Para ello, desarrollamos un modelo U-Net. La arquitectura U-Net se construye utilizando la red totalmente convolucional y está diseñada de forma que proporciona mejores resultados de segmentación en imágenes médicas. Fue diseñada por primera vez por Olaf Ronneberger, Philipp Fischer y Thomas Brox en 2015 para procesar imágenes biomédicas.

Entonces, doctor, ¿Cuál parece ser el problema?

Las imágenes de CXR centradas en el pulmón pueden entonces pasar por un modelo de aprendizaje profundo basado en una estructura DenseNet. Tomando la capa convolucional más significativa y procesándola en un mapa de calor se obtienen los píxeles de la imagen a los que el médico debe prestar atención. Hay que tener en cuenta que el médico siempre tiene la última palabra y que estos resultados solo sirven para ayudarle a decidir un diagnóstico.

La aplicación web de Dataiku permite que el modelo reciba comentarios

Gracias a la funcionalidad integrada de Dataiku para desplegar webapps, desarrollamos una aplicación de apoyo a la toma de decisiones para médicos. Los médicos podían dar retroalimentación al modelo al diagnosticar la imagen. La información se almacenaba para seguir aprendiendo de los comentarios de los expertos. La predicción del modelo, junto con la experiencia y los conocimientos del médico, hizo que la predicción global de la tarea se acercara al error de Bayes. Este proyecto es un ejemplo de cómo el ML puede ayudar a los humanos a rendir mejor cuando se trata de una tarea muy compleja.

Gracias al desarrollo de este proyecto, hemos podido aplicar técnicas similares a otros problemas. El más parecido, con el mismo tipo de imágenes, es la predicción de la edad ósea, donde el flujo es prácticamente el mismo. Otros proyectos realizados con imágenes médicas con Dataiku han sido la detección de cáncer de piel para dermatología, cáncer de mama, o el análisis de resonancias magnéticas de rodilla y próstata.

Dataiku nos ha permitido crear aplicaciones web de apoyo a la toma de decisiones para los médicos, además de recoger información sobre los resultados de los modelos, de forma que es posible mejorar aún más su rendimiento. Las aplicaciones web permiten a los médicos aplicar los modelos a imágenes concretas para obtener un resultado en poco tiempo. Estas aplicaciones permiten recoger información sobre estos resultados.

Política de Privacidad

En cumplimiento del Reglamento (UE) 2016/679 del Parlamento Europeo y del Consejo, de 27 de abril de 2016, relativo a la protección de las personas físicas en lo que respecta al tratamiento de datos personales y a la libre circulación de estos datos, usted consiente que los datos de carácter personal facilitados sean tratados por SCALIAN SPAIN para gestionar la solicitud que usted nos realice a través del presente canal online.


Los datos que usted proporcione no serán cedidos a terceros salvo que de su petición se derive la  necesidad de comunicárselos a alguna de las empresas que componen SCALIAN SPAIN o salvo que exista una obligación legal que así lo exija.

SCALIAN SPAIN le informa que puede ejercer sus derechos de acceso, rectificación, supresión, cancelación, oposición, limitación del tratamiento y portabilidad en los términos especificados en la legislación sobre protección de datos, dirigiendo una comunicación a la dirección de correo electrónico: info.spain@scalian.com o dirigiéndose por escrito a: SCALIAN SPAIN, Avda. del General Perón, 36 2ª planta, 28020 Madrid.

De igual modo, la Compañía se compromete a utilizar los datos exclusivamente de acuerdo con las finalidades reflejadas en la presente cláusula y a almacenar los mismos en los sistemas de SCALIAN SPAIN, durante el tiempo necesario para la tramitación y gestión de su solicitud.

Política de Cookies

Una cookie es un pequeño fichero de texto que se almacena en su navegador cuando visita casi cualquier página web. Su utilidad es que la web sea capaz de recordar su visita cuando vuelva a navegar por esa página. Las cookies suelen almacenar información de carácter técnico, preferencias personales, personalización de contenidos, estadísticas de uso, enlaces a redes sociales, acceso a cuentas de usuario, etc. El objetivo de la cookie es adaptar el contenido de la web a su perfil y necesidades, sin cookies los servicios ofrecidos por cualquier página se verían mermados notablemente. Para más información, puede consultar en la Ayuda de su navegador o en las páginas de soporte de los mismos:
  • Chrome: support.google.com
  • FireFox: support.mozilla.org
  • Internet Explorer: windows.microsoft.com
  • Safari: http://www.apple.com
  • Opera: http://www.opera.com/help/tutorials/security/cookies/
  • Edge: https://privacy.microsoft.com/es-es/windows-10-microsoft-edge-and-privacy
 

Cookies utilizadas en este sitio web

Siguiendo las directrices de la Agencia Española de Protección de Datos procedemos a detallar el uso de cookies que hace esta web con el fin de informarle con la máxima exactitud posible. Este sitio web utiliza las siguientes cookies propias:
  • Cookies de sesión, para garantizar que los usuarios que escriban comentarios en el blog sean humanos y no aplicaciones automatizadas. De esta forma se combate el spam.
Este sitio web utiliza las siguientes cookies de terceros:
  • Google Analytics: Almacena cookies para poder elaborar estadísticas sobre el tráfico y volumen de visitas de esta web. Al utilizar este sitio web está consintiendo el tratamiento de información acerca de usted por Google. Por tanto, el ejercicio de cualquier derecho en este sentido deberá hacerlo comunicando directamente con Google.
  • Redes sociales: Cada red social utiliza sus propias cookies para que usted pueda pinchar en botones del tipo Me gusta o Compartir.
 

Desactivación o eliminación de cookies

En cualquier momento podrá ejercer su derecho de desactivación o eliminación de cookies de este sitio web. Estas acciones se realizan de forma diferente en función del navegador que esté usando.
  • Chrome: Configuración -> Mostrar opciones avanzadas -> Privacidad -> Configuración de contenido.
  • Firefox: Herramientas -> Opciones -> Privacidad -> Historial -> Configuración Personalizada.
  • Internet Explorer: Herramientas -> Opciones de Internet -> Privacidad -> Configuración.
  • Safari: Preferencias -> Seguridad.
  • Opera: Herramientas -> Preferencias -> Editar preferencias > Cookies
  • Edge: Configuración -> Ver configuración avanzada -> Privacidad y servicios -> Cookies
 

Notas adicionales

  • Ni esta web ni sus representantes legales se hacen responsables ni del contenido ni de la veracidad de las políticas de privacidad que puedan tener los terceros mencionados en esta política de cookies.
  • Los navegadores web son las herramientas encargadas de almacenar las cookiesy desde este lugar debe efectuar su derecho a eliminación o desactivación de las mismas. Ni esta web ni sus representantes legales pueden garantizar la correcta o incorrecta manipulación de las cookies por parte de los mencionados navegadores.
  • En algunos casos es necesario instalar cookiespara que el navegador no olvide su decisión de no aceptación de las mismas.
  • En el caso de las cookiesde Google Analytics, esta empresa almacena las cookies en servidores ubicados en Estados Unidos y se compromete a no compartirla con terceros, excepto en los casos en los que sea necesario para el funcionamiento del sistema o cuando la ley obligue a tal efecto. Según Google no guarda su dirección IP. Google Inc. es una compañía adherida al Acuerdo de Puerto Seguro que garantiza que todos los datos transferidos serán tratados con un nivel de protección acorde a la normativa europea.
  • Para cualquier duda o consulta acerca de esta política de cookiesno dude en comunicarse con nosotros a través del correo electrónico: info.spain@scalian.com.