Clear Sky Science · ru

DermNet: интегративная архитектура CNN‑ViT для снижения смещения в дерматологической диагностике с использованием продвинутой несупервайзной сегментации поражений

· Назад к списку

Почему важна справедливая диагностика для тёмной кожи

Заболевания кожи затрагивают практически всех в какой‑то момент жизни — от акне и экземы до более серьёзных состояний. Однако у людей со светло‑коричневой и тёмной кожей такие проблемы сложнее заметить и легче ошибочно диагностировать как в клинике, так и инструментами искусственного интеллекта (ИИ). В этой статье представлен DermNet — новая система ИИ, разработанная для более справедливого распознавания заболеваний кожи на разных тонах, которая обучает компьютер фокусироваться на самом поражённом участке, а не на цвете окружающей кожи.

Figure 1
Figure 1.

Проблема универсальных ИИ для кожи

Большинство существующих ИИ‑систем для диагностики кожи обучаются на фотографиях, где сильно преобладает светлая кожа. При применении тех же систем к людям с более тёмным тоном точность снижается на 8–12%. В реальной жизни это может означать пропущенные ранние признаки и задержку в начале лечения. Сбор сбалансированных медицинских наборов фото тоже затруднён: изображения разбросаны по госпиталям, в некоторых странах почти нет цифровых записей, а экспертная разметка дерматологами требует времени и денег. В результате ИИ часто выучивает «хитрые» признаки, например ассоциирует некоторые болезни преимущественно с бледной кожей, вместо того чтобы по-настоящему понять, как выглядит поражение.

Научить компьютер видеть только саму рану

Авторы решают это смещение у источника — в самом изображении. Вместо подачи в модель целых снимков рук, лиц или ног они сначала автоматически вырезают только поражённую область — саму бляшку или узел — независимо от цвета окружающей кожи. Для этого они сочетают мощный открытый инструмент Segment Anything (который умеет обводить объекты без специального обучения) с классическими приёмами обработки изображений, подчёркивающими различия в цвете и яркости. Переключаясь между цветовыми пространствами и применяя автоматическое пороговое отсечение, они получают чёрно‑белые «маски», отделяющие поражение от здоровой кожи. Поразительно, но эта несупервайзная конвейерная процедура даёт примерно 90% совпадения с экспертной разметкой поражений как на светлой, так и на тёмной коже, без опоры на вручную нарисованные обучающие маски.

Figure 2
Figure 2.

Более лёгкая и умная сеть для заболеваний кожи

После изоляции поражения вступает в дело DermNet. Этот классификатор объединяет две популярные идеи ИИ: сверточные нейронные сети (CNN), хорошо улавливающие границы и текстуры, и vision transformer, умеющий выявлять дальние взаимосвязи в изображении. DermNet сначала использует всего два лёгких сверточных слоя для извлечения тонких деталей из вырезанного поражения, затем передаёт эти шаблоны в трансформер, который учится, как разные части поражения соотносятся друг с другом. Поскольку системе больше не нужно анализировать полнокадровые фотографии, она может оставаться компактной — примерно 2,5 млн параметров, менее 10 мегабайт — и при этом превосходит гораздо большие, широко используемые модели изображений.

Создание более справедливого набора данных за кулисами

Для обучения и тестирования DermNet команда объединила два набора с разметкой дерматологов в то, что они называют датасетом SkinCon. При требовании не менее 20 изображений на заболевание они получили 3 643 снимка, охватывающих 122 состояния, примерно по одной трети от светлой, коричневой и тёмной кожи. Они дополнительно расширили набор простыми трансформациями, такими как повороты и изменение яркости, чтобы снизить переобучение и повысить устойчивость. Используя этот разнообразный и кураторский набор, они обнаружили, что обучение на полных, не сегментированных изображениях приводило к нестабильному обучению и валидационной точности около 50–56%. При переходе на входы только с поражением производительность резко выросла: DermNet достиг примерно 81% валидационной точности и делал это более последовательно во всех трёх группах по тону кожи.

От лабораторного конвейера до помощника в кармане

Чтобы показать, как это может работать на практике, исследователи создали прототип мобильного приложения. Пользователь фотографирует или загружает снимок подозрительной области кожи; система автоматически сегментирует поражение, прогоняет его через DermNet и возвращает три наиболее вероятных диагноза с вероятностями — менее чем за 20 секунд — при этом окончательное решение остаётся за дерматологом. Хоть это и не замена врачу, такие инструменты могут помогать выявлять заболевания на ранней стадии, особенно в регионах с нехваткой дерматологов, и направлять ограниченное время специалистов к наиболее срочным случаям.

Что это значит для обычных пациентов

Главный вывод для неспециалистов в том, что ИИ не обязан быть „цветонезаметным“ в наивном смысле; напротив, его можно направить смотреть на правильный объект — на само поражение. Устраняя влияние фона в виде тона кожи и фокусируясь на больном участке, исследование показывает, что возможно создать компактную, точную модель, которая более одинаково обрабатывает изображения светлой, коричневой и тёмной кожи. DermNet — это первый шаг к приложениям и диагностическим системам по заболеваниям кожи, которые надёжно работают для всех, а не только для тех, чья кожа совпадает с большинством существующих медицинских фото.

Цитирование: Imran, M.H., Shahid, M., Aazam, M. et al. DermNet: integrative CNN-ViT architecture for bias mitigation in dermatological diagnostics using advanced unsupervised lesion segmentation. Sci Rep 16, 5291 (2026). https://doi.org/10.1038/s41598-026-35697-x

Ключевые слова: диагностика заболеваний кожи, смещение в медицинском ИИ, сегментация поражений, дерматологическая визуализация, vision transformer