Clear Sky Science · ru

Пошаговый подход к обучению для семантической сегментации гистологических изображений кожи

2026-03-06 · Назад к списку

Почему важно научить компьютеры «читать» образцы кожи

Рак кожи — одно из наиболее распространённых онкологических заболеваний в мире, и врачи часто полагаются на тонкие срезы ткани, рассматриваемые под микроскопом, чтобы оценить серьёзность опухоли и выбрать лечение. Чтение таких слайдов — тёмная, требовательная работа, результаты которой могут варьироваться от одного эксперта к другому. В этом исследовании рассматривают создание компьютерных систем, обучающихся распознавать разные ткани и типы рака на гистологических изображениях и, что важно, продолжающих улучшаться со временем по мере появления новых типов изображений — подобно тому, как обучающийся человек накапливает опыт в течение карьеры.

От простых ответов «да/нет» к подробным картам тканей

Многие существующие инструменты ИИ для рака кожи отвечают на узкий вопрос, например «рак» или «нет рака». Хотя такие ответы полезны, они не отражают ту богатую детализацию, которую видят патологы. На практике врачей интересуют одновременно многие структуры: разные типы рака, здоровые слои кожи, волосяные фолликулы, железы, воспалённые участки и др. В этом исследовании акцент сделан на «семантической сегментации», когда каждому пикселю гистологического изображения присваивается одна из двенадцати категорий ткани. Это даёт цветовую карту, показывающую точное расположение различных злокачественных и нормальных тканей, что обеспечивает более ясные ориентиры при постановке диагноза и планировании лечения.

Почему нынешним системам трудно адаптироваться

Современные мощные модели глубокого обучения обычно предполагают, что все обучающие данные доступны одновременно. После обучения они, как правило, «фиксируют» свои знания. Если позже появляются новые данные с другими свойствами — например, изображения при другой увеличении — чаще всего безопасней полностью переобучить модель с нуля. Это дорого и медленно, а ещё добавление новой информации может вызывать «катастрофическое забывание», когда производительность по ранее решённым задачам незаметно падает. В клинической практике данные постоянно меняются: обновляются сканеры, меняются настройки съёмки, в больницах появляются новые виды образцов. Инструмент ИИ, который не может плавно усваивать такие изменения, трудно доверять в повседневной работе.

Пошаговая стратегия обучения, вдохновлённая тем, как учатся люди

Авторы опираются на современную архитектуру vision transformer под названием SegFormer и превращают её в систему «пошагового обучения» для немеланоцитарного рака кожи. Вместо того чтобы видеть все данные сразу, модель обучается поэтапно, используя гистологические слайды из общедоступного датасета Квинслендского университета. Сначала модель учится на высоком увеличении (10×), где видны тонкие детали. Позже добавляются изображения при 5×, а затем при 2× увеличении, при этом часть ранее использованных данных с высоким разрешением остаётся в обучении. Специальные функции потерь помогают новой версии модели сохранять ранее усвоенную информацию о тканевых шаблонах, даже по мере адаптации к более грубым, «отдалённым» представлениям. Это «обучение без забывания» реализовано с помощью техники distillation знаний, где предыдущая модель выступает учителем для новой, и через взаимную дистилляцию, которая выравнивает старые и новые представления.

Обучение через уровни увеличения и редкие типы тканей

Гистологические изображения сложны не только из‑за большого числа типов тканей, но и потому, что некоторые важные структуры встречаются редко. Датасет включает распространённые опухоли, такие как базально-клеточный и плоскоклеточный рак, а также нормальные и воспалённые слои кожи, помеченные экспертами на уровне пикселя — кропотливая работа, требующая сотен часов. Авторы разрезают огромные слайды на небольшие патчи и обучают модель, аккуратно разделяя данные на обучающую, валидационную и тестовую выборки, сохраняя распределение классов тканей на каждом уровне увеличения. Чтобы помочь системе распознавать редкие, но клинически важные участки, они увеличивают представление недопредставленных классов вращением патчей и показывают модели эти ткани на нескольких масштабах. Такое мультиразрешающее изложение помогает ИИ распознавать одну и ту же биологическую структуру как в чётком крупном плане, так и в более мягком, отдалённом виде.

Что модель показывает по сравнению с ранними инструментами

Собственно SegFormer, обученный отдельно для каждого увеличения, уже превосходит ранние сверточные решения, такие как U-Net, по многим категориям тканей. Но при применении схемы пошагового обучения — сначала на 10×, затем на 10× плюс 5× и, наконец, на 10×, 5× и 2× вместе — улучшения становятся заметными. Общая точность повышается примерно с 89% при использовании только изображений 10× до более 95% после включения всех трёх увеличений. Метрики перекрытия между предсказанными и истинными регионами также стабильно улучшаются, а результаты по опухолям, таким как базально-клеточный и плоскоклеточный рак, а также по важным нормальным слоям вроде эпидермиса и папиллярного дермиса, превосходят конкурирующие методы. Существенно, что при добавлении каждого нового уровня увеличения модель не забывает ранее выученное; наоборот, её понимание структуры тканей становится более стойким и обобщающим.

Как эта работа приближает ИИ-помощь в диагностике к клинике

Для неспециалистов основная мысль такова: авторы создали «картографа» тканей кожи, который может продолжать изучать новые типы изображений, не теряя прежних навыков. Тщательно продумав поэтапный процесс обучения и способы переиспользования собственных прошлых знаний, они показывают, что возможно создавать ИИ-инструменты, способные адаптироваться по мере развития практик медицинской визуализации. Хотя требуется дополнительная валидация в разных больницах и по разным заболеваниям, этот пошаговый, основанный на трансформерах подход указывает путь к системам ИИ, которые могут оставаться актуальными при изменении данных, предлагать подробные визуальные объяснения расположения опухолей и в конечном итоге помогать патологам принимать более уверенные и последовательные решения по лечению.

Цитирование: Fatima, S., Salam, A.A., Akram, M.U. et al. Incremental learning approach for semantic segmentation of skin histology images. Sci Rep 16, 9593 (2026). https://doi.org/10.1038/s41598-025-31553-6

Ключевые слова: рак кожи, гистологические изображения, семантическая сегментация, пошаговое обучение, глубокие трансформеры