Clear Sky Science · ru

Диагностика рака молочной железы, независимая от увеличения, с использованием Vision Transformer, улучшенного GWO, и многоэтапной нормализации окрашивания

· Назад к списку

Почему это исследование важно для пациентов и врачей

Рак молочной железы сейчас — самый часто диагностируемый вид рака в мире, а микроскопическое исследование образцов тканей остаётся золотым стандартом подтверждения диагноза. При этом чтение таких слайдов требует много времени, может различаться у разных специалистов и усложняется, когда изображения получены при разных уровнях увеличения или при слегка отличающемся лабораторном окрашивании. В этом исследовании изучается, как новое поколение инструментов искусственного интеллекта может помочь патологам более последовательно обнаруживать рак, обучая компьютеры распознавать паттерны на слайдах ткани молочной железы независимо от того, как они были получены.

Упорядочивание «грязных» микроскопических снимков

В реальных больницах и лабораториях слайды тканей молочной железы редко выглядят одинаково. Различия в красителях, освещении и настройках сканера могут сдвигать цвета от тёмно‑фиолетового до бледно‑розового, даже если сама ткань схожа. Авторы сначала решают эту проблему, ещё до обучения любой ИИ‑модели. Они разрабатывают четырёхэтапный процесс приведения изображений в порядок: корректировка контраста, выравнивание общей яркости, исправление неравномерного освещения и, наконец, стандартизация внешнего вида распространённого окрашивания гематоксилин‑эозин. Обработав более 7 900 изображений из открытого датасета BreakHis, этот подход делает структуры клеток более чёткими, а цвета — более согласованными между образцами и между четырьмя стандартными уровнями микроскопического увеличения.

Figure 1
Figure 1.

Уравновешивание долей здоровых и раковых образцов

Второй практический вопрос — дисбаланс: в датасете значительно больше изображений раковых тканей, чем доброкачественных. Если это оставить без внимания, модель ИИ может «научиться» помечать всё как рак и формально получить хорошие показатели, но в реальной практике подвести пациентов. Чтобы этого избежать, исследователи искусственно расширяют недостаточно представленный класс доброкачественных образцов с помощью тщательно подобранных трансформаций, имитирующих реальные вариации. Они зеркально отражают изображения, поворачивают их, слегка меняют яркость и цвет, добавляют мягкое размытие — при этом не разрушая тонких клеточных деталей, важных для диагноза. После этого шага доброкачественные и злокачественные примеры уравновешены на каждом уровне увеличения, давая модели честный шанс выучить обе категории.

Обучение трансформера читать гистологические слайды

Вместо традиционных сверточных нейросетей команда использует Vision Transformer — архитектуру, изначально разработанную для обработки языка и затем адаптированную для изображений. Вместо сканирования картинки малыми фильтрами трансформер делит каждый слайд на множество маленьких патчей и изучает, как эти фрагменты соотносятся друг с другом по всему изображению. Такая глобальная перспектива особенно ценна в гистопатологии, где форма и расположение клеток и тканевых структур могут указывать на то, является ли опухоль безвредной или агрессивной. Модель обучают отдельно для каждого уровня увеличения (40×, 100×, 200×, 400×), а производительность оценивают стандартными метриками — точностью, точностью в предсказании класса (precision), полнотой (recall), матрицами ошибок и кросс‑валидацией — чтобы убедиться, что результаты стабильны и не являются случайным везением одной удачной разбиения на обучение и тест.

Позволяя оптимизатору, вдохновлённому природой, донастраивать ИИ

У Vision Transformer много «ручек», которые сильно влияют на качество работы: насколько глубокой должна быть сеть, сколько механизмов внимания использовать, какого размера внутренние представления, сколько применять dropout и какую скорость обучения выбрать. Вместо перебора вручную авторы обращаются к метаэвристике под названием Grey Wolf Optimizer. Вдохновлённый тем, как волки координируют преследование и окружение добычи, этот алгоритм исследует комбинации параметров и постепенно сходится к тем, которые минимизируют ошибку на валидации. Применённый отдельно для каждого увеличения, он находит конфигурации трансформера, которые более эффективно используют очищенные и сбалансированные изображения.

Figure 2
Figure 2.

Явный прирост точности на всех уровнях увеличения

После оптимизации объединённая система — предобработка с учётом окрашивания, балансировка по уровням увеличения и Vision Transformer, настроенный Grey Wolf — демонстрирует сильные и согласованные результаты. Точности на тестовой выборке достигают примерно 92% при самом низком увеличении и поднимаются до 94% при самом высоком. Важно, что злокачественные случаи обнаруживаются с несколько большей полнотой, чем доброкачественные, что критично, поскольку пропуск рака гораздо более вреден, чем избыточная маркировка доброкачественного образца для дополнительной проверки. Повторение экспериментов с пятикратной кросс‑валидацией показывает минимальные колебания, что говорит о том, что система учится устойчивым признакам, а не запоминает обучающую выборку.

Что это может значить для будущего лечения рака

Проще говоря, исследование показывает: если изображения тканей тщательно стандартизировать, а модель на базе трансформера умело настроить, система ИИ может надёжно отличать доброкачественные и злокачественные образцы молочной железы на нескольких уровнях микроскопического увеличения. Хотя работа пока ограничена одним общедоступным датасетом и бинарным решением (рак или нет), она указывает путь к клиническим инструментам, которые могли бы помочь перегруженным патологам: предварительно скрининговать слайды, выделять подозрительные участки и снижать число пропущенных случаев рака. При более широком многоцентровом валидационном исследовании и дальнейшем усовершенствовании такие не зависящие от увеличения ИИ‑ассистенты могли бы стать неотъемлемой частью цифровой патологии, способствуя более быстрой и согласованной диагностике рака молочной железы.

Цитирование: Fatma, T., Sahu, P.K., Choudhury, S. et al. Magnification-independent breast cancer diagnosis using a GWO-enhanced vision transformer with multi-stage stain normalization. Sci Rep 16, 11930 (2026). https://doi.org/10.1038/s41598-026-42490-3

Ключевые слова: гистопатология рака молочной железы, vision transformer, нормализация окрашивания, классификация медицинских изображений, оптимизация глубокого обучения