Clear Sky Science · ru

Улучшенная классификация рака кожи для малых классов с использованием конвейера условной GAN и ансамбля CNN‑ViT

· Назад к списку

Почему важны более разумные проверки кожи

Рак кожи — одно из наиболее распространённых онкологических заболеваний в мире, и раннее выявление может означать разницу между простой амбулаторной процедурой и угрозой для жизни. Дерматологи во многом полагаются на визуальные признаки в увеличенных изображениях кожи, но даже специалисты сталкиваются с трудностями, когда некоторые типы рака редки, а изображения загромождены отвлекающими деталями, например волосами. В этом исследовании представлена система искусственного интеллекта (ИИ), созданная для более справедливой работы с такими сложными, недостаточно представленными случаями, с целью поддержки более надёжного скрининга рака кожи для всех пациентов.

Неравномерные данные и трудноразличимые опухоли

Изображения в дерматологии создают несколько препятствий как для компьютеров, так и для клиницистов. На многих снимках присутствуют волосы, тени и другие артефакты, закрывающие саму патологию. Некоторые виды рака кожи очень распространены, тогда как другие — редки, поэтому основные публичные наборы данных содержат тысячи примеров доброкачественных родинок, но лишь несколько сотен изображений менее частых, но клинически важных опухолей. Стандартные модели глубокого обучения, обученные на таких несбалансированных коллекциях, как правило, отлично распознают доминирующие классы и при этом бессильно ошибаются на редких — как раз в тех случаях, где автоматическая помощь была бы наиболее полезна. Кроме того, традиционные сверточные сети часто ориентируются на мелкие фрагменты изображения и могут пропустить глобальные признаки, такие как общая асимметрия или неровность границ, важные для диагноза.

Figure 1
Figure 1.

Больше возможностей для редких случаев

Чтобы справиться с дисбалансом, авторы сначала создают интеллектуальный генератор изображений, который изучает реальные данные пациентов и затем синтезирует новые, правдоподобные примеры редких типов поражений. Вместо простого переворачивания или поворота существующих снимков их система — условная генеративно-состязательная сеть — использует «карты внимания», полученные от стандартного классификатора, чтобы увидеть, какие части каждой патологии сильнее всего влияли на предыдущие решения. Эти карты внимания выделяют медицински значимые зоны. Генератор затем создаёт новые изображения, которые сохраняют критические структуры внутри этих зон, добавляя управляемые вариации цвета, текстуры и формы. Фактически ИИ учится воображать множество правдоподобных вариантов каждой редкой опухоли, обогащая тренировочный набор без простого копирования изображений.

Два способа восприятия: локальные детали и глобальные узоры

После того как набор данных уравновешен целевыми синтетическими изображениями, за диагноз отвечает второй модуль ИИ. Исследователи комбинируют два взаимодополняющих типа моделей. Сверточная нейронная сеть (ResNet50V2) превосходна в улавливании тонких локальных признаков — едва заметных полос пигмента, тонкой текстуры и остроты краёв. Параллельно с ней модель-«визуальный трансформер» (DeiT) рассматривает каждое изображение как сетку патчей и учится тому, как удалённые области связаны между собой, улавливая свойства всей поражённой области, такие как симметрия, распространение и форма границы. Вместо того чтобы объединять их выводы только в конце, команда сливает внутренние представления через модуль слияния на основе внимания, который позволяет глобальному контексту усиливать или ослаблять отдельные локальные признаки в реальном времени.

Испытание системы

Конвейер оценивали на HAM10000, широко используемом сборнике более десяти тысяч дермоскопических изображений, охватывающих семь типов поражений — от безвредных пигментных пятен до меланомы и нескольких менее распространённых видов рака кожи. После удаления волос и тщательного разбиения на обучающую и тестовую выборки новые синтетические изображения смешивают с очищенными оригиналами, формируя сбалансированный тренировочный набор. Производительность комбинированной модели оценивают с помощью метрик по классам: точности (precision), полноты (recall) и F1‑меры, а также с помощью кривых ROC и precision‑recall. Ключевое внимание авторы уделяют тому, признаются ли редкие классы — такие как дерматофиброма, сосудистые поражения, базально‑клеточный карцином и актиническая кератоз — с той же надёжностью, что и более распространённые типы, вместо опоры на единую общую точность, которая может скрывать слабые места.

Figure 2
Figure 2.

Более уравновешенные ответы от ИИ

Полученная система демонстрирует высокую и, что важнее, сбалансированную точность по всем семи классам. Она достигает почти идеальных показателей для нескольких малочисленных опухолей и конкурентоспособных результатов для остальных типов, а также показывает низкую статистическую неопределённость при тестировании с помощью обширного бутстрэп‑пересэмплирования. Это указывает на то, что улучшения — не случайный эффект переотборки, а следствие синергии между генерацией изображений с направляющим вниманием и классификатором с двумя режимами восприятия. Для неспециалиста ключевой вывод таков: более продуманная архитектура ИИ — а не только увеличение размеров моделей — может помочь сделать автоматические инструменты скрининга рака кожи менее склонными пропускать редкие, но опасные заболевания. Хотя необходимы дополнительные проверки на более широких многопроцентровых наборах данных перед клиническим внедрением, работа указывает путь к ИИ‑ассистентам, которые уделяют равное внимание каждому кожному поражению, будь оно частым или редким.

Цитирование: Hussain, S.R., Saritha, S., Chevuri, A. et al. Enhanced skin cancer classification for minority classes using Conditional GAN pipeline and CNN-ViT ensemble. Sci Rep 16, 13114 (2026). https://doi.org/10.1038/s41598-026-43339-5

Ключевые слова: обнаружение рака кожи, медицинские изображения ИИ, несбалансированность классов, синтетические медицинские изображения, визуальные трансформеры