Clear Sky Science · ru

Продвинутая гибридная архитектура transformer–CNN для улучшенной классификации и сегментации кожных поражений

· Назад к списку

Почему важно обнаруживать рак кожи на ранней стадии

Рак кожи — одно из самых распространённых онкологических заболеваний в мире, но при раннем обнаружении он входит в число наиболее поддающихся лечению. Врачам всё чаще помогают крупные снимки родинок и пятен при решении, какие из них представляют опасность. Тем не менее даже эксперты сталкиваются с трудностями, когда изображения имеют низкую контрастность, плохое освещение или закрыты волосами. В этом исследовании представлена новая система искусственного интеллекта (ИИ), призванная помочь: она не только определяет тип кожного поражения, но и с высокой точностью очерчивает зону интереса даже на сложных изображениях.

Figure 1
Figure 1.

Двухэтапный помощник для врачей

Авторы предлагают двухступенчатую систему, имитирующую работу дерматолога. Сначала их модель, названная GlobalSkinNet, анализирует увеличенное изображение кожи и определяет наиболее вероятный тип поражения, разделяя доброкачественные образования и опасные опухоли, такие как меланома. Затем компаньон-модель SkinFormNet берёт то же изображение и строит детальную маску, по пикселю отображающую границу поражения. Вместе эти два шага дают и ответ «что это?», и ясную карту «где это?», которые могут поддержать диагностику, планирование лечения и мониторинг изменений во времени.

Новые способы выявления паттернов на кожных снимках

Внутри обе модели объединяют два мощных, но разных подхода ИИ. Сверточные нейронные сети хороши в обнаружении тонких текстур и контуров — например, неровных границ или едва заметных цветовых переходов в родинке. Сетевые трансформеры, изначально созданные для языка, превосходны в понимании глобального контекста, то есть того, как разные области изображения взаимосвязаны. GlobalSkinNet использует «глобально-контекстный» трансформер, который разбивает изображение на перекрывающиеся патчи и применяет как локальное, так и широкое внимание, что позволяет улавливать тонкие визуальные подсказки, сохраняя при этом представление о общей форме и окружении поражения. SkinFormNet применяет трансформер в роли извлекателя признаков вместе с U-образным декодером, который постепенно восстанавливает чёткий аккуратный контур поражения.

Проверено на реальных, «грязных» данных

Ключевая сила работы — широкий объём тестирования. Многие ранние исследования ИИ опираются на одну–две аккуратные базы данных, а здесь система оценивалась почти на всех крупных публичных коллекциях дермоскопических изображений, включая PH2, HAM10000 и задания ISIC с 2016 по 2020 год. Эти наборы отличаются типом камер, освещением, качеством изображений и популяциями пациентов, и включают как доброкачественные, так и злокачественные поражения. Несмотря на это разнообразие, GlobalSkinNet достигает примерно 97–100% точности на нескольких наборах и сохраняет высокую чувствительность к меланоме — самой смертоносной форме рака кожи. SkinFormNet также показывает очень высокое совпадение между своими предсказанными масками и контурами, нарисованными экспертами, часто превосходя предыдущие ведущие методы.

Figure 2
Figure 2.

Заглядывая в решения модели

Поскольку медицинский ИИ должен быть заслуживающим доверия, исследователи также изучают, на что именно обращает внимание система. С помощью техники визуализации, выделяющей наиболее влиятельные области изображения для принятия решения, они показывают, что модель склонна фокусироваться на клинически значимых зонах: неровных границах, цветовых вариациях и асимметрии поражения, при этом в значительной степени игнорируя фон кожи, волосы и измерительные линейки. Когда система ошибается, её промахи похожи на случаи, трудные для человека — например, очень размытые границы или поражения, постепенно переходящие в нормальную кожу. Эти анализы позволяют предположить, что поведение модели согласуется с рассуждениями дерматологов о риске, а не опирается на случайные подсказки.

Что это значит для будущих осмотров кожи

Проще говоря, это исследование представляет ИИ‑ассистента, который может одновременно и классифицировать подозрительную родинку, и аккуратно закрасить её форму, даже когда снимок шумный или неравномерно освещён. Объединяя два дополняющих подхода нейронных сетей, фреймворк обеспечивает более надёжную работу, чем многие ранние инструменты, ориентированные на одну задачу. Хотя системе ещё требуются клинические испытания в реальных условиях и облегчённые версии для повседневных устройств, работа указывает на будущее, в котором дерматологи смогут использовать такие системы в качестве «второго взгляда» — помогая обнаруживать опасные опухоли раньше, сокращать число ненужных биопсий и в итоге улучшать исходы для пациентов.

Цитирование: Yousaf, N., Amin, J., Butt, W.H. et al. Advanced hybrid transformer CNN framework for improved skin lesion classification and segmentation. Sci Rep 16, 13592 (2026). https://doi.org/10.1038/s41598-026-43376-0

Ключевые слова: рак кожи, дермоскопия, глубокое обучение, медицинская визуализация, сегментация поражений