Clear Sky Science · ru

Точная классификация кожных поражений на несбалансированных дермоскопических изображениях с высокой дисперсией с помощью фреймворка SCTFD

2026-03-05 · Назад к списку

Почему важны более продуманные проверки кожи

Рак кожи — один из самых распространённых видов рака, но при раннем обнаружении он также входит в число наиболее излечимых. Дерматологи всё чаще опираются на крупные снимки родинок и пятен, сделанные с помощью ручного увеличителя — дерматоскопа, чтобы решить, какие из них представляют опасность. Однако интерпретировать такие изображения непросто, даже экспертам, а компьютерные системы, теоретически способные помочь, часто ошибаются, потому что некоторые типы рака редки, а поражения могут сильно различаться у разных пациентов. В этом исследовании представлен новый фреймворк искусственного интеллекта SCTFD, разработанный для повышения точности и надёжности автоматической классификации кожных поражений именно в таких сложных условиях.

Проблема редких и хитрых кожных пятен

Реальные коллекции изображений кожи далеки от сбалансированности. Распространённые, в основном безвредные родинки встречаются в обучающих данных тысячами раз, тогда как серьёзные виды рака, такие как меланома, или редкие опухоли появляются всего несколько сотен раз или реже. При этом поражения одной и той же болезни могут сильно различаться по размеру, цвету и форме. Стандартные системы ИИ склонны переобучаться на распространённых шаблонах и игнорировать редкие, что в медицине опасно: ошибиться в пользу безвредной родинки лучше, чем пропустить меланому. Классические подходы, например простое копирование редких изображений, их смешивание или использование сложных генеративных моделей, имеют ограничения по реалистичности, стабильности или вычислительным затратам. SCTFD создан специально для работы с этой несбалансированностью и вариабельностью, оставаясь при этом достаточно эффективным для практического применения.

Формирование лучших тренировочных примеров

Первый компонент SCTFD — генератор данных CN-SMOTE. Вместо простого интерполирования пикселей или обучения нестабильной генеративной состязательной сети CN-SMOTE использует пару энкодера и декодера: одна сеть сжимает дермоскопическое изображение в компактный внутренний код, другая восстанавливает изображение из этого кода. После того как такое компактное пространство изучено, метод находит близких соседей среди поражений редких классов и интерполирует их коды, затем декодирует смешанные коды обратно в новые изображения. Специальный штраф в процессе обучения удерживает внутренние коды поражений одного типа близкими друг к другу, чтобы синтетические изображения оставались реалистичными и соответствовали заболеванию. В результате получается более крупная и сбалансированная коллекция дермоскопических изображений, где редкие, но важные типы поражений представлены лучше.

Учет деталей и общей картины

Второй компонент, MARD-Net, сосредоточен на том, чтобы превратить каждое изображение в богатый набор признаков. Сверточные слои ведут себя как настраиваемые увеличительные стекла, улавливающие тонкие паттерны — границы и текстуры. Поверх этого модуль внимания обучает сеть концентрироваться на небольшой области, где находится само поражение, уменьшая влияние окружающей здоровой кожи, которая может отвлекать модель. Наконец, стадия на базе Трансформера просматривает всё изображение, чтобы уловить взаимосвязи между удалёнными частями поражения, например, как распределены разные цвета и структуры. Чтобы избежать большой вычислительной нагрузки, обычно связанной с Трансформерами, авторы вводят стратегию скользящего окна, которая даёт модели широкий взгляд на поражение, выполняя при этом расчёты внимания только в выбранных участках — это делает модель быстрее и экономичнее по памяти.

Мотивирование модели справедливо относиться ко всем классам

Третья опора SCTFD — новая функция потерь FDLoss, которая указывает ИИ, как корректировать себя в процессе обучения. Вместо того чтобы считать каждое изображение одинаково важным, FDLoss подчёркивает сложные и редкие случаи, чтобы модель не могла «плыть по инерции», хорошо работая только на многочисленных и простых примерах. Она сочетает идеи двух популярных правил оценки: одного, которое вознаграждает хороший баланс между чувствительностью и точностью, и другого, которое уменьшает вклад тривиальных примеров, которые сеть уже классифицирует правильно. Сверх этого FDLoss добавляет член, поощряющий формирование плотных групп в внутреннем пространстве для изображений одной болезни и раздвигающий разные болезни на большее расстояние. Такое сочетание прямо противодействует как несбалансированности классов, так и большой вариативности внутри каждого класса, которые обычно сбивают с толку классификаторы.

Насколько хорошо работает новый подход

Авторы протестировали SCTFD на двух широко используемых международных бенчмарках дермоскопических изображений, ISIC 2018 и ISIC 2019, которые содержат десятки тысяч реальных клинических дермоскопических снимков по семи и восьми типам поражений соответственно и сильно смещены в сторону распространённых родинок. По сравнению с несколькими современными методами SCTFD показал более высокую точность и заметно лучшую сбалансированность между обнаружением истинно положительных случаев и снижением ложных тревог. Он повысил общую точность примерно до 93% на ISIC 2018 и до 91% на ISIC 2019 и поднял F1‑меру — показатель, уравновешивающий пропуски и неверные метки — выше всех конкурентов. Визуализации показали, что модули внимания действительно фокусируются на областях поражений, а признаки разных болезней после обучения становятся более чётко разделёнными.

Что это значит для пациентов и врачей

Для пациентов обещание SCTFD — более надёжное «второе мнение» при появлении подозрительного пятна на коже. Путём синтеза реалистичных примеров редких видов рака, концентрации на наиболее информативных частях каждого изображения и обучения с функцией потерь, которая принуждает к чёткому разделению типов заболеваний, фреймворк снижает риск того, что автоматические системы пропустят опасные поражения только потому, что они редки или атипичны. Хотя это не заменяет суждение дерматолога, такой подход может снизить барьер для ранней и точной диагностики в клиниках и телемедицинских платформах, потенциально позволяя выявлять опасные для жизни раки кожи раньше и более последовательно.

Цитирование: Li, X., Ouyang, J., Chen, Y. et al. Accurate skin lesion classification on imbalanced dermoscopic images with high variance via the SCTFD framework. Sci Rep 16, 12302 (2026). https://doi.org/10.1038/s41598-026-37846-8

Ключевые слова: обнаружение рака кожи, дермоскопия и ИИ, классификация медицинских изображений, несбалансированные наборы данных, глубокое обучение в дерматологии