Clear Sky Science · ru

Мультиуровневый гибрид ResNet–трансформер с обучением с учётом расстояния для интерпретируемой классификации маммограмм по BI-RADS

2026-02-20 · Назад к списку

Почему это важно для пациентов и врачей

Скрининг на рак молочной железы спасает жизни, но определить, какие маммограммы действительно указывают на опасность, бывает сложно даже для экспертов. В этом исследовании представлен новый компьютерный инструмент, который стремится более точно и прозрачно распределять снимки по привычным категориям риска BI-RADS. Это может помочь сократить число ненужных биопсий, выявлять опасные опухоли раньше и дать рентгенологам дополнительное, понятное мнение вместо таинственного "чёрного ящика".

От снимков груди к категориям риска

Маммограммы обычно интерпретируют по шкале BI-RADS, которая варьируется от «нормально» до «высокой подозрительности на рак». Наиболее критичны категории BI-RADS 3, 4 и 5, где принимают решения о коротком сроке наблюдения или биопсии. Человеческие читатели могут приходить к разным выводам, особенно у женщин с плотной тканью молочной железы, что может приводить как к пропущенным случаям рака, так и к лишним тревогам. Чтобы поддержать рентгенологов, авторы обучили систему искусственного интеллекта на публичном наборе маммограмм, в котором экспертные читатели уже пометили изображения по категориям BI-RADS от 1 до 5. Им также пришлось решить распространённую проблему: нормальных и явно доброкачественных снимков было гораздо больше, чем высокорисковых, что при отсутствии корректировки может исказить обучение.

Как новый «умный» ридер видит изображения

Предложенная система сочетает две недавние идеи в анализе изображений. Во‑первых, она использует глубокую свёрточную сеть (ResNet-50) для улавливания тонких деталей — границ, текстур и мелких ярких точек, которые могут указывать на микрокальцинаты. Во‑вторых, добавлен модуль трансформера, архитектура, ставшая популярной в языковых моделях, чтобы связывать удалённые части изображения и рассуждать об общих паттернах и симметрии. До этого маммограммы тщательно предобрабатываются: изменяется размер, повышается контрастность, чтобы выделить тонкие поражения, и редкие категории уравновешиваются методом перевыборки, чтобы модель во время обучения видела достаточно примеров подозрительных и злокачественных случаев.

Обучение модели учитывать, что некоторые ошибки важнее

Стандартные компьютерные модели рассматривают все ошибки категорий как одинаково серьёзные, но в медицине это не так. Ошибка, при которой явно нормальный снимок принимают за явно злокачественный, куда серьёзнее, чем путаница между соседними категориями, например BI-RADS 2 и 3. Чтобы отразить это, авторы вводят стратегию обучения «с учётом расстояния». Вместо простого подсчёта правильных и неправильных ответов, функция потерь также измеряет, на каком расстоянии находится предсказание от истинной категории на упорядоченной шкале BI-RADS. Большие разрывы наказываются сильнее, чем близкие промахи, что подталкивает систему к более плавным, клинически осмысленным границам между уровнями риска и помогает избегать самых опасных ошибок классификации.

Как система показала себя в тестах

Обученная и настроенная в два этапа, система продемонстрировала высокую эффективность при оценке на отложенной тестовой выборке. В целом она правильно присваивала категории BI-RADS примерно в 92% случаев и получила очень высокие показатели по метрикам, учитывающим несбалансированность классов и сложность многоклассовой задачи. Важно, что она была особенно точна для BI-RADS 4 и 5 — групп, которые чаще всего приводят к биопсиям. Почти все её ошибки были между соседними категориями, что соответствует серой зоне, с которой сталкиваются рентгенологи в реальной практике. Дополнительные анализы показали, что прогнозируемые вероятности хорошо калиброваны — то есть заявленная уверенность соответствовала частоте правильных ответов — и что модель превосходила несколько недавних подходов глубокого обучения, разработанных для схожих задач.

К чему приводят эти результаты

Эта работа показывает, что сочетание свёрточных и трансформерных идей и явное обучение модели учитывать, что некоторые ошибки хуже других, может создать ИИ‑ассистента, который одновременно точен и более согласован с клиническим мышлением. Хотя исследование ограничено умеренным объёмом данных из одного источника и лишено внешней валидации, оно указывает путь к системам ИИ, которые не только сопоставимы по результатам с рентгенологами, но и объясняют, на что обращают внимание, и насколько уверены в выводе. При дальнейшем тестировании на больших и более разнообразных популяциях такие инструменты могут стать надёжными партнёрами в скрининге рака молочной железы, помогая обеспечить, что нужным женщинам назначается нужное последующее обследование в нужное время.

Цитирование: Singh, M., Mohan, A., Tripathi, U. et al. A multi-scale hybrid ResNet–transformer with distance-aware learning for interpretable BI-RADS mammographic classification. Sci Rep 16, 10033 (2026). https://doi.org/10.1038/s41598-026-40906-8

Ключевые слова: скрининг рака молочной железы, ИИ в маммографии, классификация BI-RADS, глубокое обучение в радиологии, объяснимая медицинская визуализация