Aprendizaje automático y diagnóstico de cáncer

Nuria Martín Cardenal

Abstract

Un subgrupo destacable de la inteligencia artificial es el aprendizaje automático, en el que las computadoras aprenden a realizar tareas mediante el análisis de datos generando sus propios algoritmos de toma de decisiones. Su poder radica en la capacidad de identificar patrones entre millones de datos para hacer clasificaciones y predicciones. Su aplicación en medicina es extremadamente útil, por ejemplo para interpretar imágenes radiológicas, reduciendo retrasos en el diagnóstico, para realizar tareas repetitivas como valorar enfermedad metastásica en ganglios linfáticos, y para hacer cribado de retinopatía diabética.

Pese al gran potencial del aprendizaje automático, existen limitaciones inherentes como es el diagnóstico de etapas tempranas del cáncer. Para entender esto es importante saber cómo trabaja la tecnología: se basa en un proceso llamado aprendizaje supervisado, en que la computadora valora imágenes que han sido etiquetadas como la “verdad fundamental”. En el caso del cáncer, se realiza mediante diapositivas de histopatología, con un conjunto inicial marcado por los patólogos como “cáncer” o “no cáncer”, que posteriormente se divide en un conjunto de entrenamiento y un conjunto de prueba. Usando el conjunto de entrenamiento la computadora desarrolla un algoritmo que discrimina mejor “cáncer” de “no cáncer”. El rendimiento del algoritmo se evalúa usando el conjunto de prueba. En cada paso del proceso el sistema aprende juzgando su diagnóstico contra el estándar externo de interpretación patológica.

Sin embargo, el aprendizaje automático no resuelve el problema central asociado al diagnóstico de cáncer, la falta de un “estándar oro” histopatológico. El problema del patrón oro se ha visto en estudios interobservador entre patólogos y se han documentado desacuerdos sobre diagnóstico histopatológico en lesiones de próstata, tiroides y mama, así como en sospecha de melanoma. Está claro que los patólogos pueden estar en desacuerdo, especialmente en el diagnóstico temprano, pero no está claro qué patólogos están identificando correctamente los cánceres clínicamente significativos. Además, ahora se les pide que hagan juicios sobre anormalidades celulares microscópicas sutiles, algunas de las cuales pueden cumplir la definición patológica de cáncer pero pueden no estar destinadas a causar síntomas o muerte, lo que lleva al sobrediagnóstico.

Los algoritmos del aprendizaje automático en etapas tempranas serán más consistentes que los basados en la interpretación humana, pero no necesariamente estarán más cerca de la verdad, así que tampoco resolverán el problema del sobrediagnóstico. De hecho, este problema puede incluso agravarse, dado que las máquinas pueden leer más diapositivas en menos tiempo y es más económico que un patólogo humano, por lo que más tejidos y más pacientes sólo conduce a sobrediagnóstico.

Un enfoque planteado para evitar esto sería entrenar a los algoritmos para discriminar en tres categorías: acuerdo total con respecto a la presencia de cáncer, acuerdo total respecto a la ausencia de cáncer y desacuerdo con respecto a si hay cáncer presente (es decir, zonas “grises”). Hay varias razones que apoyan esta categorización: la eficiencia, ya que los patólogos podrían centrarse en muestras con características histológicas ambiguas; por otro lado, destacando zonas “grises” podría alentar a médicos y pacientes a actitudes más conservadoras cuando se enfrentan a lesiones de importancia incierta; y, por último, fomentaría una mayor investigación sobre la historia natural de las lesiones intermedias.

Lo importante para pacientes y médicos es si el diagnóstico de cáncer tiene relevancia para la duración o la calidad de vida. Entrenar algoritmos de aprendizaje automático para reconocer categorías intermedias debe considerarse antes de adoptar esta tecnología, siendo una oportunidad para que los patólogos discutan las decisiones sobre lo que constituye el cáncer.

 

Publicado
07-02-2020