Clear Sky Science · ru
Различная диагностика рака молочной железы по шкале BI-RADS с использованием MobileNetV1 и визуального трансформера на основе объяснимого искусственного интеллекта (XAI)
Раннее обнаружение риска рака
Рак молочной железы легче всего лечится на ранних стадиях, но чтение маммограмм — сложная работа в условиях дефицита времени. В этом исследовании описана новая система искусственного интеллекта (ИИ), спроектированная не только для высокоточного выявления признаков рака на маммограммах, но и для показа врачам именно тех участков изображения груди, которые повлияли на её решения. Комбинируя два современных подхода к анализу изображений, система призвана поддерживать радиологов быстрыми, надёжными и прозрачными вторыми мнениями.

Почему чтение маммограмм так сложно
Маммограммы — это рентгеновские снимки молочной железы, используемые для проверки на ранние признаки рака. Радиологи присваивают каждому исследованию балл по шкале BI-RADS, стандартизированной шкале, охватывающей состояние от нормальных находок до явно злокачественных. При плотной ткани груди, где много железистой ткани, подозрительные участки могут скрываться или выглядеть похоже на безвредные структуры. Многие предыдущие компьютерные инструменты либо ограничивались простыми решениями «да/нет» по наличию рака, либо испытывали трудности с полным диапазоном категорий BI-RADS, либо работали как «чёрный ящик», оставляя врачей в неведении относительно причин конкретного решения.
Сочетание двух способов «видеть» изображение
Исследователи создали гибридную ИИ‑схему, которая имитирует то, как внимательный человек читает маммограмму: сначала рассматривая мелкие детали, затем оценивая общую картину. Одна часть системы, основанная на компактной сети MobileNetV1, концентрируется на локальных деталях, таких как крошечные кальцификаты и чёткие контуры поражений. Вторая часть, визуальный трансформер, разбивает изображение на патчи и анализирует взаимосвязи между ними по всей груди, улавливая общую структуру ткани и тонкие искажения. Признаки из этих двух «потоков» затем объединяются в единое, насыщенное описание каждого изображения.
Очистка, балансировка и упрощение данных
Перед подачей в ИИ‑конвейер изображения проходят несколько этапов предобработки. Команда улучшает контраст с помощью метода, который осветляет тонкие структуры, не усиливая шум, делая слабые участки более заметными. Изображения изменяются в размере и нормализуются, чтобы система видела их в согласованном виде. Чтобы компенсировать редкость некоторых категорий BI-RADS, например явно злокачественных случаев, авторы применяют приёмы увеличения данных — небольшие повороты и отражения — и используют обучение с учётом классов, чтобы менее распространённые категории имели влияние в процессе обучения. После извлечения признаков обоими потоками математический инструмент, называемый методом главных компонент, сжимает эту информацию, сохраняя главное и уменьшая сложность.

От признаков к оценке риска с объяснениями
На финальном этапе, вместо тяжёлого непрозрачного нейронного классификатора, авторы используют множество простых логистических регрессий, объединённых ансамблем методом «bagging». Каждая модель предоставляет понятную связь между признаками изображения и уровнями риска по BI-RADS, а их голосование большинства обеспечивает стабильность и устойчивость к переобучению на относительно небольшом наборе данных. Проверенная на более чем 6000 маммограммах из набора данных King Abdulaziz University Breast Cancer, гибридная система показала более 99% точности, чувствительности и специфичности по четырём ключевым категориям BI-RADS, на которые она была нацелена: нормально, вероятно доброкачественно, подозрительно и злокачественно.
Чтобы врачи видели то, что видит ИИ
Чтобы сделать решения понятными, система использует техники объяснимого ИИ, известные как Grad-CAM и Grad-CAM++. Они создают цветные тепловые карты, наложенные на маммограмму, выделяющие области, которые сильнее всего повлияли на предсказанный балл BI-RADS. В злокачественных случаях выделенные области обычно совпадают с массами или скоплениями кальцификаций, отмеченными экспертами‑радиологами; в нормальных изображениях наблюдается мало или совсем нет сфокусированной активации. Такая визуальная обратная связь помогает клиницистам оценить, обращает ли модель внимание на медицински значимые признаки, и может объяснить, почему некоторые пограничные случаи — например плотная ткань, имитирующая поражение — сложны даже для экспертов.
Что это может значить для пациентов
Исследование показывает, что на одном клиническом наборе данных эта двухпоточная объяснимая ИИ‑система способна классифицировать маммограммы по нескольким уровням риска с точностью, сравнимой и в некоторых отношениях превосходящей многие предыдущие методы. Хотя её ещё нужно протестировать на более разнообразных популяциях и в разных больницах, подход указывает на инструменты ИИ, которые не только весьма точны, но и достаточно быстры для загруженных клиник и достаточно прозрачны, чтобы заслуживать доверие радиологов и пациентов. На практике такие системы могли бы выступать как дополнительная пара экспертных глаз — отмечая тонкие находки, снижая число пропущенных случаев рака и способствуя более ясным и уверенным разговорам о риске рака молочной железы.
Цитирование: Abdelsabour, I., Elgarayhi, A., Sallah, M. et al. Different BI-RADS breast cancer diagnosis using MobileNetV1 and vision transformer based on explainable artificial intelligence (XAI). Sci Rep 16, 7190 (2026). https://doi.org/10.1038/s41598-026-37199-2
Ключевые слова: рак молочной железы, маммография, искусственный интеллект, визуальный трансформер, объяснимый ИИ