Clear Sky Science · ru
Анализ гибридных моделей CNN, оптимизированных метаэвристическими алгоритмами, для обнаружения меланомы
Почему важны более разумные проверки кожи
Меланома — опасная форма рака кожи, которая может быстро распространяться, если ее не обнаружить на ранней стадии. Дерматологи теперь используют камеры и программное обеспечение вместе с осмотром невооруженным глазом, но разработка надежных систем искусственного интеллекта (ИИ) для таких изображений по-прежнему представляет собой задачу. В этом исследовании изучается новый подход к созданию таких систем: разрешить стратегиям поиска, вдохновленным природой, автоматически проектировать и настраивать модель глубокого обучения с целью обнаруживать больше случаев меланомы при контролируемом уровне ложных срабатываний.

Обучение компьютеров видеть проблемные участки кожи
Исследователи сосредотачиваются на дермоскопических изображениях — крупномасштабных, увеличенных снимках родинок, сделанных специальным устройством. Эти изображения содержат тонкие закономерности цвета, текстуры и формы, которые могут указывать на рак. Сверточные нейронные сети (CNN) — тип ИИ, особенно хорошо распознающий такие визуальные паттерны, но они капризны: их работа зависит от множества проектных решений, например, от числа слоев, размеров фильтров и скорости обучения. Традиционно эксперты подбирают или вручную настраивают эти параметры либо повторно используют архитектуры из несвязанных задач, что ограничивает способность моделей адаптироваться к изображениям кожи.
Разрешив стратегиям, вдохновленным природой, проектировать модель
Вместо того чтобы заранее фиксировать CNN, авторы превращают весь процесс проектирования в задачу поиска. Они объединяют CNN с шестью так называемыми метаэвристическими алгоритмами — стратегиями поиска, вдохновленными природными поведениями, такими как кукушки, подкладывающие яйца в гнезда других птиц, стаи волков, охотящиеся вместе, или косяки птиц и их ройное поведение. В этом подходе каждая метаэвристика рассматривает полноценный дизайн CNN, включая основные настройки обучения, как кандидатное решение. Она затем генерирует множество таких кандидатов, проверяет каждый, фактически обучая и валидационно тестируя CNN на изображениях кожи, и постепенно направляет популяцию в сторону более эффективных конструкций на основе того, насколько точно они различают меланому и доброкачественные поражения.
Сначала очистка и обогащение изображений
Прежде чем начнется обучение, сами изображения требуют тщательной подготовки. Команда использует широко применяемую коллекцию HAM10000, содержащую более одиннадцати тысяч дермоскопических изображений семи типов поражений кожи, включая меланому. Они приводят все изображения к стандартному размеру, выравнивают различия в яркости и удаляют отвлекающие артефакты, такие как волосы и метки, которые могут сбивать модель с толку. Чтобы помочь CNN справляться с разнообразием, встречающимся в реальной клинической практике, затем создаются новые, слегка модифицированные версии каждого изображения меланомы путем зеркального отражения, вращения, масштабирования, обрезки и изменения яркости. Это также служит способом уравновесить число примеров меланомы и немеланомных образцов, чтобы модель не научилась просто отдавать предпочтение более частому классу.
Испытание шести стратегий поиска
В пределах очищенного и расширенного набора данных шесть метаэвристик — Cuckoo Search, Firefly Algorithm, Whale Optimization Algorithm, Particle Swarm Optimization, Grey Wolf Optimizer и Crow Search Algorithm — каждая ищет сильные конфигурации CNN. Они исследуют такие параметры, как число сверточных слоев, количество фильтров в слое, применение стабилизирующей техники под названием пакетная нормализация (batch normalization), размер обучающего батча и скорость обучения, контролирующая, как быстро модель обновляет свои внутренние параметры. Для каждого предложенного дизайна CNN строится, обучается и проверяется на отдельном валидационном наборе, а ее точность возвращается в алгоритм поиска в виде оценки, направляющей следующий раунд кандидатов. Этот цикл повторяется в рамках нескольких экспериментальных схем, которые варьируют размеры популяции и число итераций для каждого оптимизатора.

Какие стратегии сработали лучше всего
Все шесть подходов породили CNN, превзошедшие тщательно сконструированную, вручную настроенную базовую сеть. Базовая модель показала примерно 84 процента правильных классификаций, тогда как лучшие модели, управляемые метаэвристиками, достигли около 91 процента точности. Две алгоритма выделились. Cuckoo Search обеспечил наивысшую общую точность и чувствительность — то есть особенно хорошо обнаруживал меланомы и снижал риск пропуска злокачественных образований. Grey Wolf Optimizer продемонстрировал сопоставимо высокую точность и при этом лучше всего распознавал доброкачественные поражения, снижая число ненужных тревог. Другие методы, такие как Firefly Algorithm, показали конкурентоспособные результаты, но с большей вариабельностью, тогда как Particle Swarm и Crow Search склонялись к более ранней сходимости в менее оптимальные области пространства дизайна.
Заглядывая внутрь «рассуждений» модели
Поскольку медицинский ИИ должен вызывать доверие у клиницистов, авторы также исследуют, как оптимизированные CNN принимают решения. С помощью техники визуализации Grad‑CAM++ они генерируют цветные тепловые карты поверх входных изображений, показывающие, на что сеть «смотрит», когда объявляет поражение злокачественным или доброкачественным. В удачных случаях эти карты фокусируются на самом пятне, а не на окружающей коже или оставшихся артефактах, и выделяют неправильные структуры, которые совпадают с тем, что сами дерматологи считают подозрительным. Когда система ошибается, это часто происходит из-за поражений, визуально неоднозначных даже для специалистов, например доброкачественных участков с грубой текстурой или ранних меланом с очень слабым контрастом.
Что это означает для будущих обследований кожи
Для неспециалиста ключевой вывод таков: исследование демонстрирует, что предоставление стратегиям поиска, вдохновленным природой, возможности проектировать внутренние компоненты модели глубокого обучения может сделать автоматическое обнаружение меланомы более точным и более надежным по сравнению с ручной настройкой экспертов. Систематически сравнив несколько таких стратегий на одном большом публичном наборе данных, авторы выделяют Cuckoo Search и Grey Wolf Optimizer как особенно перспективные инструменты для создания будущих клинических систем поддержки принятия решений. Хотя эти системы не предназначены для замены дерматологов, они могут стать ценными «вторыми читателями», помогая снизить вероятность пропуска опасных поражений и уменьшить число ненужных тревог и процедур при доброкачественных образованиях.
Цитирование: Hermosilla, P., Soto, R., Monfroy, E. et al. Analysis of hybrid CNN models optimized with metaheuristic algorithms for melanoma detection. Sci Rep 16, 13075 (2026). https://doi.org/10.1038/s41598-026-42711-9
Ключевые слова: обнаружение меланомы, дермоскопическая визуализация, сверточные нейронные сети, метаэвристическая оптимизация, медицинский искусственный интеллект