Clear Sky Science · es
Rendimiento de los algoritmos de predicción de riesgo de cáncer de mama entre sistemas de mamografía en el programa de cribado del Reino Unido
Por qué esto importa para las mujeres y sus familias
El cribado mamográfico salva vidas al detectar cánceres de forma temprana; sin embargo, muchos tumores siguen apareciendo en los años entre mamografías rutinarias, con frecuencia en fases más avanzadas. Este estudio plantea una pregunta simple pero importante: ¿puede la inteligencia artificial (IA) leer una mamografía “normal” y señalar discretamente a mujeres que en realidad tienen un alto riesgo a corto plazo, para que se les ofrezcan controles adicionales antes de que el cáncer crezca y se disemine?

Ver más en una mamografía normal
La mayoría de los programas nacionales de cribado, incluido el del Reino Unido, invitan a las mujeres a una mamografía cada tres años. Si no se ve nada sospechoso, se les comunica que la exploración es “negativa” y vuelven a su vida habitual. No obstante, alrededor del 30 % de los cánceres de mama en mujeres cribadas son “cánceres intervalo” que aparecen entre visitas programadas y suelen tener un pronóstico peor. Recientemente, potentes sistemas de IA han aprendido a analizar mamografías que parecen normales para el lector humano y asignar a cada mujer una puntuación de riesgo a corto plazo. La idea es usar esta información oculta para personalizar la frecuencia del cribado y decidir quién debería recibir pruebas más sensibles, como resonancia magnética o mamografía con contraste.
Poniendo a prueba cuatro herramientas de IA
Los investigadores examinaron 112.621 mamografías de cribado negativas de dos centros del NHS Breast Screening Programme en Inglaterra, cubriendo una ronda completa de tres años entre 2014 y 2017 y siguiendo a las mujeres durante cinco años. Los dos centros utilizaron máquinas de mamografía digital distintas (Philips y GE), reproduciendo la variación real. Durante el seguimiento, 1.225 mujeres desarrollaron cáncer de mama, incluyendo 396 cánceres intervalo y otros cánceres detectados en la siguiente ronda de cribado. Cuatro algoritmos líderes de riesgo basados en IA —tres comerciales y un modelo académico— se ejecutaron localmente en cada mamografía para generar una puntuación de riesgo de cáncer futuro, y se comparó su rendimiento.
Qué tan bien detectaron los algoritmos los cánceres futuros
Los cuatro sistemas de IA consiguieron distinguir, mejor que el azar, entre mujeres que desarrollarían cáncer y las que no, pero no rindieron por igual. Un algoritmo (etiquetado DL‑1) mostró de forma consistente el mejor rendimiento, mientras que otro (DL‑3) se quedó atrás. Al centrarse en los cánceres intervalo —los que aparecen poco después de una exploración “normal”— el mejor modelo alcanzó niveles de precisión similares o superiores a los observados en estudios previos de un solo algoritmo. Es importante que tres de las cuatro herramientas se comportaron de forma parecida en imágenes de Philips y GE, lo que sugiere que pueden manejar al menos algunas diferencias en el hardware de captura, aunque un algoritmo rindió notablemente peor en uno de los sistemas.
Qué ocurre si actuamos según las puntuaciones de mayor riesgo
La cuestión práctica para los servicios de cribado es cuántas mujeres convocar en función de las puntuaciones de IA. Los investigadores por tanto analizaron puntos de corte clínicamente relevantes. Si solo se seleccionara para atención extra al 4 % con mayor riesgo (según las puntuaciones de cada herramienta), los dos mejores algoritmos juntos detectarían aproximadamente una de cada cinco de todos los cánceres futuros y más de una cuarta parte de los cánceres intervalo. Al relajar el umbral hasta el 14 % de puntuaciones más altas —más cercano a las tasas de convocatoria vistas en algunos programas de Norteamérica— el rendimiento se duplicó aproximadamente: el modelo más fuerte identificó alrededor del 42 % de todos los cánceres futuros y la mitad de los cánceres intervalo. Sin embargo, cada algoritmo tendía a señalar un subconjunto de cánceres parcialmente diferente, con relativamente poca superposición, lo que sugiere que estrategias en conjunto o con varias herramientas podrían encontrar más tumores que cualquier modelo individual.

Fortalezas, lagunas y siguientes pasos
Este trabajo destaca porque utiliza datos completos y de rutina de dos grandes centros de cribado del NHS en lugar de una muestra de investigación estrechamente seleccionada, y es el primero en evaluar varias herramientas de riesgo de IA nombradas codo con codo en el entorno del Reino Unido. Al mismo tiempo, tiene limitaciones. Se excluyó a mujeres con implantes o con vistas de imagen no estándar, y el estudio abarcó solo dos marcas de mamógrafos, por lo que el rendimiento en otros equipos o entre distintos grupos étnicos sigue siendo incierto. Dado que el análisis fue retrospectivo, algunos cánceres que podrían haberse detectado antes con imagen adicional basada en riesgo no se contabilizaron, lo que significa que el beneficio real podría ser mayor que el informado.
Qué implica esto para el cribado mamográfico futuro
Para un lector general, la conclusión es que la IA moderna puede, efectivamente, encontrar señales de aviso en mamografías “normales” que predicen qué mujeres tienen más probabilidad de desarrollar cáncer de mama en breve, especialmente los cánceres intervalo que de otro modo son difíciles de detectar temprano. En principio, los mejores algoritmos podrían permitir a los programas de cribado ofrecer pruebas más frecuentes o más sensibles a un grupo relativamente pequeño de mujeres de mayor riesgo, mientras que el resto seguiría con controles estándar cada tres años. No obstante, las diferencias entre herramientas y entre sistemas de imagen muestran que ningún modelo de IA está listo para adoptarse en todas partes sin pruebas cuidadosas. Los autores abogan por ensayos prospectivos grandes que usen múltiples algoritmos, junto con ajuste fino para los escáneres y las poblaciones locales, antes de que el cribado mamográfico guiado por IA y basado en riesgo pueda convertirse en atención rutinaria de forma segura.
Cita: Rothwell, J., Payne, N., Kilburn-Toppin, F. et al. Performance of breast cancer risk prediction algorithms across mammography systems in the UK screening programme. npj Digit. Med. 9, 330 (2026). https://doi.org/10.1038/s41746-026-02507-7
Palabras clave: cribado de cáncer de mama, inteligencia artificial, mamografía, predicción de riesgo, cánceres intervalo