Clear Sky Science · ru

Улучшение классификации рака легкого с помощью гибридного CNN-HiFuse с двойным механизмом внимания

2026-03-11 · Назад к списку

Почему важно обнаруживать рак легкого на ранней стадии

Рак легкого — один из самых смертельных видов рака в мире, во многом потому, что его часто обнаруживают на поздних стадиях, когда варианты лечения ограничены. Радиологи уже используют детальные КТ-снимки для поиска маленьких очагов в легких, которые могут быть злокачественными, но внимательное рассмотрение каждого среза бывает утомительным и медленным — и небольшие или слабовыраженные узелки легко пропустить. В этом исследовании рассматривается, как продвинутый искусственный интеллект может выступать в роли неутомимого второго взгляда, помогая врачам обнаруживать проблемы с легкими раньше и отличать безвредные находки от опасных.

Преобразование грудных сканов в ясные категории

Авторы сосредотачиваются на практическом трехвариантном решении, с которым радиологи сталкиваются ежедневно: показывает ли срез КТ нормальную ткань легкого, доброкачественный узелок или злокачественный узелок? Они используют общедоступный набор данных из онкологического центра в Ираке, содержащий 1 190 срезов КТ от 110 пациентов, каждый пациент помечен как нормальный, с доброкачественным или злокачественным узелком. Чтобы не завысить оценку качества модели, данные разделяют по пациентам, а не по изображениям, так что срезы одного и того же человека никогда не попадают одновременно в тренировочную и тестовую выборки. Также стандартизируют размер, яркость и формат изображений и применяют аугментацию данных — например, повороты, отражения и изменения яркости — чтобы система лучше справлялась с реальной вариативностью и чтобы сбалансировать менее частые случаи доброкачественных и злокачественных образований.

Как интеллектуальный анализатор видит изображения

В основе системы лежит сверточная нейронная сеть — тип ИИ, особенно хорошо распознающий закономерности на изображениях. Смоделированная архитектура, названная Double Attention Hybrid CNN–HiFuse, адаптирована к особенностям КТ грудной клетки. Сначала она использует стандартные сверточные слои для выделения базовых визуальных признаков, таких как края и текстуры. Затем специализированный модуль HiFuse объединяет информацию на разных масштабах: одна ветвь улавливает широкий, глобальный контекст по всему легкому, а другая фокусируется на локальных деталях вокруг потенциальных узелков. Иерархическое слияние этих представлений позволяет сети лучше замечать как мелкие очаги, так и более крупные структуры, которые их окружают.

Обучение системы тому, куда смотреть

Кроме простого извлечения признаков, модель активно учится, где следует сосредоточить внимание. Механизм «двойного внимания» действует двояко. Канальное внимание придает больший вес наиболее информативным типам признаков — например, тем, которые особенно хорошо отличают злокачественный узелок от рубцовой ткани — снижая влияние отвлекающих сигналов. Пространственное внимание концентрируется на конкретных областях изображения, выделяя подозрительные участки в легком и подавляя фон. Эти два типа внимания применяются последовательно, помогая системе формировать компактное и сфокусированное представление каждого среза, которое затем передается в финальный классификатор, выдающий вероятности нормальной, доброкачественной или злокачественной ткани.

Насколько хорошо работает подход

Для настройки множества параметров — например, числа фильтров, скорости обновления внутренних весов и силы регуляризации сети — авторы применяют автоматизированный инструмент поиска. С оптимальными настройками они сравнивают свою гибридную модель с несколькими сильными базовыми архитектурами, включая известные глубокие сети, такие как VGG16 и ResNet50, а также с настраиваемой сетью с вниманием. На независимом тестовом наборе из 213 срезов КТ их модель Double Attention Hybrid CNN–HiFuse достигает примерно 98 процентов точности, с очень высоким значением precision и recall. Всего модель неправильно классифицирует четыре среза и демонстрирует особенно низкие показатели пропуска злокачественных узелков — критически важный показатель безопасности. Кривые рабочей характеристики приемника (ROC), измеряющие способность модели разделять классы при разных порогах, приближаются к идеалу для всех трех категорий.

Перспективы и ограничения для клинического применения

Для неспециалистов главный вывод таков: исследование демонстрирует быструю, относительно легковесную систему ИИ, способную с впечатляющей точностью классифицировать КТ-изображения легких по трем клинически значимым группам, одновременно предоставляя карты внимания, показывающие области, которые сильнее всего повлияли на решение. Это делает инструмент более интерпретируемым и повышает доверие радиологов, рассматривающих его как вспомогательное средство, а не «черный ящик». Однако результаты получены в одном госпитале, основаны на 2D-срезах вместо полноценных 3D-сканов и используют упрощенную трехклассовую схему маркировки, поэтому их следует рассматривать как обнадеживающий первый шаг, а не окончательное доказательство. При дальнейшем тестировании на больших и более разнообразных наборах данных и при интеграции в клинические рабочие процессы подобные модели с механизмами внимания могут помочь выявлять рак легкого раньше и снизить нагрузку на перегруженных специалистов по визуализации.

Цитирование: M. D, A., B, V. Enhancing lung cancer classification through a double attention hybrid CNN-HiFuse approach. Sci Rep 16, 13099 (2026). https://doi.org/10.1038/s41598-026-42290-9

Ключевые слова: рак легкого, КТ-сканирование, глубокое обучение, компьютерная поддержка диагностики, механизмы внимания