Clear Sky Science · es

Precisión diagnóstica, equidad e implementación clínica de la IA para la cribado de cáncer de mama: resultados de estudios técnicos multicéntricos de viabilidad retrospectivos y prospectivos

· Volver al índice

Cribado más inteligente para mujeres de a pie

El cribado del cáncer de mama salva vidas, pero también tensiona los sistemas sanitarios y puede no detectar algunos cánceres o provocar falsas alarmas estresantes. Este estudio plantea una pregunta simple con grandes implicaciones: ¿puede un programa de inteligencia artificial (IA) ayudar de forma segura a leer mamografías en el programa nacional de cribado del Reino Unido, detectando más cánceres peligrosos mientras alivia la carga sobre especialistas saturados—y haciéndolo de forma justa para mujeres de distintos entornos?

Figure 1
Figure 1.

Cómo funciona el cribado hoy

En muchos países, incluido el Reino Unido, se invita a mujeres de 50 a 70 años a realizarse mamografías periódicas. En el Reino Unido, cada exploración suele leerse de forma independiente por dos expertos humanos; si discrepan, un panel revisa el caso. Este sistema de doble lectura está diseñado para ser seguro, pero lleva tiempo y depende de disponer de suficientes lectores formados, algo con lo que muchos sistemas sanitarios tienen dificultades. Herramientas informáticas anteriores ofrecieron ayuda limitada y a veces añadieron ruido en lugar de claridad, por lo que las autoridades sanitarias han exigido pruebas sólidas antes de confiar en la IA moderna dentro de los programas nacionales.

Poner la IA a prueba en clínicas reales

Los investigadores evaluaron la IA actualizada de mamografías de Google en dos fases principales en el Servicio Nacional de Salud del Reino Unido. Primero, ejecutaron el sistema sobre casi 116 000 exámenes de cribado pasados de cinco regiones diferentes, siguiendo a las mujeres durante más de tres años para ver qué cánceres realmente surgieron. Luego compararon el rendimiento de la IA con el del primer lector humano, el segundo lector y la decisión final del panel. En una segunda fase, instalaron silenciosamente la IA en 12 centros de cribado y la dejaron procesar más de 9 000 exámenes nuevos en tiempo real—sin influir en la atención—para estudiar cómo se comportaba en la práctica diaria y cómo podrían ajustarse sus parámetros.

Qué vio la IA—y qué detectó

En el extenso conjunto de datos retrospectivo, la IA fue más sensible que el primer lector humano: detectó más cánceres en general manteniendo su tasa de falsas alarmas dentro de un margen de seguridad preestablecido. Si se hubiera usado como uno de los lectores en el flujo de doble lectura, el sistema habría aumentado la tasa de detección de cánceres de aproximadamente 7,5 a 9,3 cánceres por cada 1 000 mujeres, y marcó correctamente uno de cada cuatro cánceres que originalmente se pasaron por alto y se descubrieron más tarde, ya fuera entre cribados o en la siguiente visita rutinaria. Las ganancias fueron especialmente notables en mujeres que acudían a su primera prueba—por lo general el grupo más difícil de interpretar porque no hay imágenes previas. En estas visitas iniciales, la IA devolvió menos citaciones y aun así detectó ligeramente más cánceres, en particular tumores invasivos que plantean la mayor amenaza.

Equidad, carga de trabajo y obstáculos del mundo real

El equipo examinó con detalle si la IA trataba a distintos grupos de mujeres de forma equitativa. Según la edad, la densidad mamaria, el estatus socioeconómico y los limitados datos de etnia disponibles, no observaron señales consistentes de sesgos dañinos: sensibilidad y especificidad se mantuvieron dentro de márgenes estrechos en comparación con los lectores humanos, aunque algunos subgrupos muy pequeños presentaron gran incertidumbre. También modelaron cómo el uso de la IA como segundo lector reconfiguraría la carga de trabajo. El número de lecturas humanas antes de la revisión por panel podría reducirse casi a la mitad, recortando el tiempo del lector en aproximadamente un tercio, aunque más casos se remitirían al panel. En la fase de viabilidad en vivo, la IA entregó resultados en minutos—mucho más rápido que la lectura humana rutinaria—pero el equipo detectó un cambio en la apariencia de las imágenes recientes respecto a los datos de entrenamiento más antiguos. Un umbral operativo inicial resultó ser demasiado sensible, provocando tasas de citación más altas, y tuvo que recalibrarse a la baja usando datos locales nuevos.

Figure 2
Figure 2.

Construir un sistema de cribado listo para la IA

Más allá de la precisión, el estudio puso de manifiesto barreras prácticas para un despliegue seguro. Muchos centros de cribado aún dependen de formularios en papel y software heredado que no puede almacenar automáticamente resultados de la IA ni explicar por qué se citó una exploración—funciones que reguladores y clínicos necesitan. Los autores sostienen que los flujos de trabajo totalmente digitales y estandarizados y una mejor recogida de datos demográficos serán cruciales para monitorizar el rendimiento y la equidad a lo largo del tiempo. También insisten en que los umbrales de la IA no pueden ser “configurar y olvidar”: el equipo de imagen, el comportamiento de los lectores y la mezcla poblacional cambian, por lo que el sistema debe comprobarse y ajustarse de forma continua, con normas nacionales claras y apoyo técnico.

Qué significa esto para las pacientes

Los hallazgos sugieren que un sistema de IA desplegado con cuidado podría ayudar a los programas nacionales de cribado mamográfico a detectar más cánceres graves en fases tempranas, especialmente en mujeres que asisten a su primera mamografía, al tiempo que alivie la carga de trabajo de especialistas sobrecargados. Aun así, los autores enfatizan que el éxito depende de algo más que un algoritmo preciso. Los servicios sanitarios necesitarán calibración continua, monitorización rigurosa frente a deriva y sesgos, actualización de la infraestructura informática e integración reflexiva en los flujos de trabajo humanos existentes. Con estas salvaguardias, la IA podría convertirse en un lector adicional de confianza que mejore tanto la eficiencia como la equidad del cribado del cáncer de mama, en lugar de una caja negra que añada nuevos riesgos.

Cita: Kelly, C.J., Wilson, M., Warren, L.M. et al. Diagnostic accuracy, fairness and clinical implementation of AI for breast cancer screening: results of multicenter retrospective and prospective technical feasibility studies. Nat Cancer 7, 494–506 (2026). https://doi.org/10.1038/s43018-026-01127-0

Palabras clave: cribado de cáncer de mama, inteligencia artificial médica, mamografía, equidad en la atención sanitaria, implementación clínica