Clear Sky Science · ru
DermaScanAI — объясняющая гибридная глубинная модель для автоматизированной классификации кожных поражений с использованием двойного внимания и слияния метаданных
Почему важны более умные проверки родинок
Рак кожи — одно из самых распространенных онкологических заболеваний, и его раннее обнаружение может спасти жизни. Тем не менее многие люди откладывают проверку подозрительной родинки на месяцы или годы, а даже опытным врачам порой трудно оценить сложные случаи. В этом исследовании представлен DermaScanAI — компьютерная система, предназначенная помочь врачам отделять безвредные пятна от опасных, анализируя детальные снимки кожи и базовую информацию о пациенте, а также наглядно показывая, на что именно она «смотрела», чтобы принять решение.
Обучение компьютеров «читать» изображения кожи
Дерматологи часто используют портативный прибор — дермоскоп — чтобы получить крупные планы родинок и других пятен. Эти изображения показывают едва заметные цветовые и текстурные узоры, которые могут указывать на рак, но в них много отвлекающих факторов: волосы, неравномерное освещение и различия камер. DermaScanAI начинает с очистки изображений: цифрово удаляет волосы, выравнивает яркость и цвета, увеличивает участок поражения до стандартизированного размера. Затем система расширяет данные — переворачивает изображения, поворачивает и слегка меняет цвета, чтобы компьютер увидел множество реалистичных вариаций каждого поражения и лучше справлялся с разнообразием в реальной практике.

Видеть и тонкие детали, и общую картину
Многие предыдущие компьютерные инструменты для распознавания рака кожи ориентировались либо только на локальные мелкие паттерны, либо только на общую форму, что вызывает путаницу, когда очень разные поражения частично выглядят похоже. DermaScanAI сочетает два подхода к распознаванию паттернов, чтобы избежать этой проблемы. Сначала современная сверточная сеть, тип движка для обработки изображений, выделяет тонкие детали — края, цветовые точки и текстуры на нескольких масштабах, от крошечных фрагментов до больших областей. Поверх этого работают модули внимания, которые позволяют системе «усиливать» наиболее информативные цветовые каналы и участки изображения, одновременно подавляя несущественные фоновые области.
Добавление глобального контекста и подсказок от пациента
После выделения важнейших областей изображения DermaScanAI передает уточненные признаки в легкий трансформерный модуль. Эта часть модели хорошо связывает удаленные участки изображения, поэтому она может соотнести центр родинки с ее краем и окружающей кожей. Одновременно система учитывает простую информацию о пациенте: возраст, пол и локализацию поражения. Эти подсказки отражают клиническую практику, где темная точка на ноге у молодого человека может нести иной риск, чем похожая точка на спине у пожилого пациента. Сливая признаки изображения с этими базовыми данными перед принятием решения, модель имитирует способ мышления дерматолога, учитывающего контекст.

Принятие решений, которые врачи могут проверить
Основной барьер для внедрения ИИ в клинику — многие системы кажутся «черными ящиками». Чтобы решить эту проблему, DermaScanAI включает модуль объяснимости. С помощью техники Grad-CAM++ он генерирует тепловые карты, показывающие, какие участки поражения сильнее всего повлияли на решение; другой метод, SHAP, оценивает, насколько каждая часть информации, включая метаданные пациента, сдвинула результат в сторону того или иного диагноза. Когда эти тепловые карты накладывают на исходные изображения и сравнивают с контурами поражения, проведенными экспертами, наблюдается сильное совпадение, что указывает на то, что система фокусируется на медицински значимых областях, а не на случайном шуме.
Насколько хорошо работает система
Исследователи протестировали DermaScanAI на HAM10000 — большой публичной коллекции более 10 000 дермоскопических изображений, охватывающей семь типов кожных поражений, включая меланому, обычные родинки и несколько доброкачественных состояний. После обучения и тщательной проверки с множественными разбиениями данных модель достигла примерно 94.8% общей точности, макро‑среднего F1‑балла около 92% и площади под ROC‑кривой 0.962, что указывает на высокую способность разделять типы поражений. Она также оставалась достаточно точной при обучении на лишь части данных и в сравнении выглядела выгодно по отношению к другим передовым системам, основанным исключительно на сверточных сетях или трансформерах, при меньших вычислительных затратах.
Что это значит для будущих проверок кожи
Проще говоря, работа показывает, что тщательно спроектированная компьютерная модель может с высокой надежностью сортировать разные типы кожных поражений, использовать простую информацию о пациенте для уточнения суждений и показывать врачам, куда она «смотрит» на коже. DermaScanAI пока не является автономным диагностическим инструментом: ему необходимо тестирование в разных больницах, с разными камерами и группами пациентов до поддержки реальных клинических решений. Но модель предлагает ясную схему для будущих помощников по раннему выявлению рака кожи, которые будут одновременно точными и прозрачными, что может помочь врачам обнаруживать опасные поражения раньше и повысить уверенность пациентов и клиницистов в принимаемых решениях.
Цитирование: Murali, P., Mazumder, D.H. DermaScanAI an explainable hybrid deep learning framework for automated skin lesion classification using dual attention and metadata fusion. Sci Rep 16, 15130 (2026). https://doi.org/10.1038/s41598-026-46011-0
Ключевые слова: рак кожи, дермоскопия, глубокое обучение, медицинский ИИ в визуализации, объяснимый ИИ