Clear Sky Science · es
Un sistema de IA interpretable reduce los falsos positivos en diagnósticos por RM al estratificar lesiones mamarias de alto riesgo
Exploraciones más inteligentes, menos procedimientos innecesarios
La RM de mama es una de las mejores herramientas para detectar el cáncer de forma temprana, especialmente en mujeres con alto riesgo, pero con frecuencia detecta “demasiado”, señalando muchas zonas inocuas como sospechosas. Estos hallazgos en el área gris generan ansiedad, pruebas adicionales y biopsias dolorosas que, al final, resultan benignas. Este estudio presenta un nuevo sistema de inteligencia artificial (IA) que interpreta las resonancias mamarias junto con los radiólogos y ayuda a distinguir las lesiones realmente peligrosas de las que pueden vigilarse con seguridad, con el objetivo de detectar cáncer sin enviar a tantas mujeres a la mesa de biopsias.

El problema de los hallazgos inciertos en la RM de mama
Cuando los radiólogos leen una RM mamaria, etiquetan las áreas sospechosas usando una escala llamada BI-RADS. La categoría 4 es la más problemática: abarca lesiones con una probabilidad de cáncer que va del 2% al 95%. Debido a que ese rango es tan amplio, la práctica habitual es biopsiar casi todas. Como resultado, muchas mujeres se someten a procedimientos invasivos para lesiones que resultan ser benignas. Además, la interpretación de la RM es subjetiva. Diferentes radiólogos, sobre todo los menos experimentados, pueden discrepar sobre la misma exploración, a veces sobreestimando hallazgos benignos o pasando por alto cánceres sutiles. Los autores se propusieron crear una herramienta que reduzca esta incertidumbre y, al mismo tiempo, se integre en la práctica hospitalaria real.
Un socio de IA entrenado con miles de exploraciones
Los investigadores desarrollaron el Sistema de Análisis de Lesiones BI-RADS 4, o BL4AS, un modelo de IA diseñado específicamente para estos hallazgos de alto riesgo pero ambiguos en la RM. A diferencia de sistemas anteriores que se basaban en una sola imagen, BL4AS analiza múltiples puntos temporales tras la inyección de un medio de contraste, siguiendo cómo cada lesión realza y decrece con el tiempo. Estos patrones dinámicos aportan pistas importantes sobre si un tejido es probablemente benigno o maligno. El equipo primero preentrenó un gran “modelo fundacional” con más de 17.000 volúmenes de RM para aprender características generales de imagen, y luego lo afinó con 2.803 lesiones BI-RADS 4 procedentes de 2.686 mujeres atendidas en tres centros médicos. El sistema tanto delimita la lesión como la clasifica en riesgo bajo o alto, ofreciendo una probabilidad de que sea cáncer.
Rendimiento superior al de los lectores humanos en clínicas reales
Para evaluar el desempeño de BL4AS fuera del laboratorio, los autores lo probaron con datos independientes de otros hospitales y con un grupo prospectivo de pacientes recolectado recientemente. En estos contextos, la IA mostró una alta precisión y, lo que es crucial, una especificidad mucho mayor que la de los radiólogos; es decir, fue mejor identificando lesiones benignas y evitando falsas alarmas. En un estudio prospectivo de lectura, ocho radiólogos interpretaron primero los casos por su cuenta y luego los releyeron con la ayuda de BL4AS. Con el apoyo de la IA, su precisión diagnóstica aumentó, su tasa de falsos positivos se redujo en más de una cuarta parte y el acuerdo entre lectores mejoró notablemente. Los radiólogos junior fueron los que más se beneficiaron, acercando su rendimiento al de sus colegas sénior cuando usaron el sistema.

Haciendo las decisiones de la IA transparentes y accionables
Dado que los clínicos son comprensiblemente cautelosos ante la IA tipo “caja negra”, el equipo incorporó explicaciones visuales. BL4AS genera mapas de calor que resaltan qué partes de una lesión influyeron en su decisión, frecuentemente centrando la atención en formas irregulares, bordes nítidos y patrones de realce inusuales que los radiólogos ya asocian con el cáncer. El sistema también va más allá de una simple predicción binaria de cáncer asignando las lesiones a subgrupos BI-RADS 4A, 4B o 4C que reflejan un riesgo creciente. En conjuntos de prueba externos, estas subcategorías definidas por la IA se correspondieron estrechamente con las tasas reales de cáncer y realizaron un mejor trabajo que los radiólogos tanto para identificar lesiones de bajo riesgo que podrían evitar la biopsia como para señalar lesiones de alto riesgo que deben tratarse con prontitud.
Qué podría significar esto para las pacientes
En conjunto, el estudio sugiere que un asistente de IA interpretable como BL4AS puede ayudar a los radiólogos a leer las RM de mama de forma más consistente, reducir biopsias innecesarias y, aun así, mantener un margen de seguridad muy alto frente a cánceres no detectados. Al utilizar la riqueza completa de los datos temporales de la RM y presentar su razonamiento de forma accesible para las personas, el sistema ofrece un camino práctico hacia una atención del cáncer de mama más personalizada: las mujeres con lesiones realmente preocupantes pueden pasar rápidamente al tratamiento, mientras que aquellas con hallazgos de bajo riesgo podrían evitar procedimientos invasivos y, en su lugar, ser seguidas de cerca en el tiempo.
Cita: Liang, Y., Wei, Z., Dai, Y. et al. An interpretable AI system reduces false-positive MRI diagnoses by stratifying high-risk breast lesions. Nat Commun 17, 2263 (2026). https://doi.org/10.1038/s41467-026-69212-7
Palabras clave: RM de mama, inteligencia artificial, diagnóstico del cáncer, imagen médica, estratificación de riesgo