Clear Sky Science · ru

R3MV: новая надежная архитектура системы для классификации рака кожи с использованием прогрессивной разнородной многоблочной модели

· Назад к списку

Почему это исследование важно для вашей кожи

Рак кожи — один из наиболее распространенных видов рака в мире, и раннее выявление нередко определяет разницу между простой процедурой и угрожающим жизни заболеванием. Дерматологи всё чаще обращаются к искусственному интеллекту, чтобы помочь обнаружить опасные родинки на снимках, сделанных камерами и дерматоскопами. Но если разные ИИ‑системы дают разные ответы по одному и тому же участку кожи, какому из них доверять врачу? В этом исследовании предложен новый способ объединить несколько ИИ‑точек зрения в одно более надежное решение о том, злокачественное ли образование.

Figure 1
Figure 1.

Проблема доверия одной «умной» машине

Большинство существующих инструментов ИИ для диагностики рака кожи обучаются как одна мощная модель на одном наборе данных. Такие системы могут производить впечатление в лабораторных тестах, но их эффективность часто падает при столкновении с изображениями из других клиник, с других камер или от иных групп пациентов. Предыдущие оценки в дерматологии указали на слабую внешнюю валидацию и плохую обобщаемость: модели, хорошо работающие на одном тщательно отобранном наборе, могут давать сбои в реальных больницах. Поскольку неверный ответ может задержать лечение или привести к ненужной биопсии, авторы считают рискованным полагаться на любую единственную модель в клинических решениях.

Новая система голосования с несколькими «голосами»

Чтобы решить эту проблему, исследователи предлагают трёхуровневую архитектуру под названием R3MV — надежная трёхуровневая система большинства голосов. Вместо того чтобы спрашивать ответ у одной модели, R3MV прогоняет одно и то же изображение кожи через три разных канала принятия решений. Первый путь использует глубокую сверточную нейронную сеть, которая напрямую классифицирует изображение. Второй путь пропускает изображение через несколько разных глубоких сетей, объединяет найденные ими шаблоны и передаёт эти сжатые признаки традиционному классификатору. Третий путь анализирует предсказания множества отдельных моделей и обучает дополнительный классификатор на их выходах. Наконец, система принимает решение по большинству голосов между тремя путями, так что итоговый вердикт отражает консенсус, а не единственное мнение.

Более умный способ чтения изображений кожи

В основе первого пути лежит специальная модель изображений под названием Progressive Heterogeneous Multi‑Block CNN (PHMBCNN). Эта сеть построена из нескольких специализированных блоков, каждый из которых подчёркивает разные визуальные аспекты образования — от тонких текстур до более крупных структур — прогрессивно, от мелких к глубоким слоям. Авторы дополнительно усилили эту модель, добавив Gated Recurrent Unit (GRU), тип модуля памяти, который помогает сети улавливать взаимосвязи между каналами и слоями. Обновленная версия PHMBCNN‑GRU служит как сильным самостоятельным классификатором, так и важным источником признаков для других путей системы.

Позволяя нескольким моделям учиться вместе

Второй путь направлен на объединение сильных сторон разнообразных сетей для работы с изображениями. То же изображение передаётся через PHMBCNN‑GRU и через несколько популярных предварительно обученных моделей, изначально разработанных для общих фотографий. Каждая модель извлекает собственный высокоразмерный «отпечаток» образования. Эти отпечатки конкатенируются и затем сжимаются с помощью методов, устраняющих избыточную или бесполезную информацию, оставляя только наиболее информативные признаки. Многослойный персептрон, классическая многослойная нейросеть, затем обучается классифицировать образования на основе этого уточненного совместного описания, эффективно объединяя то, что «видит» каждая модель, в одно более чёткое представление.

Figure 2
Figure 2.

Превращение разногласий в более сильный ответ

Третий путь, называемый слиянием на уровне решений, смотрит ещё более высоко. Здесь авторы рассматривают предсказанную каждой моделью метку как входной сигнал и обучают метод опорных векторов распознавать шаблоны в соглашениях и разногласиях моделей. Этот мета‑классификатор учится, например, когда определённые комбинации моделей обычно указывают на доброкачественное образование или когда конкретная модель склонна ошибаться на определённых типах поражений. Во всех трёх путях исследователи тщательно предварительно обрабатывали изображения — изменение размера, удаление артефактов волос и балансировка классов — чтобы лучше отразить неряшливую реальность клинических снимков, сделанных как дерматоскопами, так и смартфонами.

Насколько хорошо система работает на практике

Команда протестировала свой подход на двух широко используемых коллекциях изображений рака кожи: HAM10000, содержащем высококачественные дерматоскопические снимки из клиник, и PAD_UFES_20, включающем фотографии со смартфонов с более сильными артефактами, такими как густые волосы и следы чернил. Улучшенная модель PHMBCNN‑GRU сама по себе показала повышение точности по сравнению с базовой версией на обоих наборах. Ещё важнее, что при объединении всех трех путей путём большинства голосов в системе R3MV производительность возросла: около 99% точности на HAM10000 и примерно 82% на PAD_UFES_20. Удаление волос с изображений также последовательно улучшало результаты, что подчёркивает, насколько важна тщательная очистка изображений для автоматической диагностики.

Что это значит для будущих проверок кожи

Для неспециалистов главный вывод заключается в том, что эта работа переводит ИИ для рака кожи от одной «чёрной коробки» к панели независимых «мнений», которые должны совпасть, прежде чем пометить образование как подозрительное. Хотя R3MV не полностью решает задачу одинаково хорошей работы во всех клиниках и на всех типах камер, он показывает, что смешение разных моделей и голосование между ними может давать более надёжные ответы, чем опора только на одну. Со временем такие многопутевые системы могли бы поддерживать дерматологов, предлагая более стабильные, объяснимые и заслуживающие доверия оценки того, какие участки кожи требуют пристального внимания или биопсии.

Цитирование: Reshma, S.K., Reeja, S.R. R3MV: a novel reliable system architecture for skin cancer classification using progressive heterogeneous multiblock model. Sci Rep 16, 13599 (2026). https://doi.org/10.1038/s41598-026-40522-6

Ключевые слова: обнаружение рака кожи, дерматологический ИИ, ансамбли глубокого обучения, анализ медицинских изображений, компьютерная поддержка диагностики