Clear Sky Science · ru
Федеративная сегментация узелков легких с использованием гибридной архитектуры Transformer–U-Net
Почему важно обнаруживать крошечные очаги в легких
Рак легкого — самый смертоносный вид рака в мире, но его самые ранние предупреждающие признаки — крошечные очаги, называемые узелками, на КТ-сканах — легко пропустить. Радиологам приходится просматривать тысячи детальных изображений, а обмен данными пациентов между больницами для обучения более умных алгоритмов часто блокируется строгими правилами конфиденциальности. В этом исследовании предложен способ, который позволяет больницам совместно «обучать» систему искусственного интеллекта (ИИ) находить узелки в легких точно, не передавая при этом исходные сканы пациентов.
Делиться знаниями, не делясь сканами
Современные КТ-сканеры фиксируют детали легких с точностью до долей миллиметра, но такая точность порождает поток изображений, который никому не просмотреть вручную. Инструменты с поддержкой компьютера могут помочь, однако им нужны большие, разнообразные наборы данных, чтобы не пропускать нетипичные узелки. Законы вроде HIPAA и GDPR запрещают просто объединять данные пациентов в одном месте. Авторы используют стратегию, называемую федеративным обучением, чтобы решить эту проблему. Каждая клиника обучает копию одной и той же модели локально на своих КТ-сканах и затем отправляет на центральный сервер только параметры модели, а не сами изображения. Сервер усредняет эти параметры в улучшенную «глобальную» модель и возвращает её назад, позволяя всем участникам воспользоваться опытом друг друга, оставаясь при этом с данными пациентов внутри своей организации. 
Очистка изображений перед обучением ИИ
Исследование сосредоточено на «солидных» узелках легких размером от 15 до 25 мм, которые клинически значимы, но занимают всего несколько пикселей в каждом срезе КТ, из‑за чего их легко упустить. Прежде чем начнется обучение, каждый срез КТ проходит двухэтапную процедуру предобработки. Сначала метод усиления контраста CLAHE делает слабые узелки более яркими, не усиливая шум, что помогает выделить тонкие очаги. Затем изображения нормализуют — масштабируют так, чтобы все значения пикселей находились в диапазоне от 0 до 1, что задает модели единый масштаб яркости для сканов с разных устройств и в разных больницах. Такая стандартизированная предобработка помогает ИИ сосредоточиться на крошечных, низкоконтрастных узелках, а не запутываться в артефактах сканеров.
Сочетание двух способов «видения»: локальная детальность и общая картина
В основе системы — гибридная сеть, объединяющая две мощные идеи современной ИИ: U‑Net, превосходную в выделении объектов на изображениях, и Transformer, изначально разработанный для языка, но теперь широко используемый в задачах зрения. U‑образная часть модели сначала сжимает изображение через слои мелких фильтров, эффективно улавливающих локальную текстуру — грани, пятна и тонкие границы — затем восстанавливает маску оригинального размера, помечая пиксели, принадлежащие узелку. Резюдальные соединения и переходы (skip connections) переносят тонкие детали через сеть, чтобы они не терялись. В середине этой U‑формы находится «бутылочное» звено — Transformer, который рассматривает патчи изображения как токены в предложении и применяет self‑attention для соотнесения отдалённых областей. Это позволяет модели видеть одновременно крошечный узелок и его более широкое анатомическое окружение, что важно, когда узелок сливается с прилегающими сосудами или структурами грудной клетки. 
Работа с редкими целями и несбалансированными данными
Авторы также решают ключевую проблему медицинской визуализации: дисбаланс классов. В КТ грудной клетки почти каждый пиксель — фон; пиксели узелков встречаются редко. Стандартное обучение часто поощряет модели, которые просто помечают всё как фон. Чтобы противостоять этому, команда комбинирует две функции потерь — Dice loss, которая напрямую вознаграждает совпадение предсказанных и истинных областей узелков, и Focal loss, которая добавляет вес трудноклассифицируемым пикселям. Этот союз Dice–Focal заставляет модель обращать внимание на маленькие, сложные узелки и чёткие границы. В их федеративной настройке с пятью имитированными «клиентами»‑больницами, обученными на публичном наборе LUNA16, система достигла значений Dice до 0.93 для солидных узелков и показала низкие показатели как пропусков узелков, так и ложных тревог. Производительность оставалась высокой у большинства клиентов несмотря на различия в качестве изображений и внешнем виде узелков, хотя узелки с расмытыми или смешанными плотностями всё ещё представляли трудность.
Что это значит для будущего скрининга легких
Проще говоря, работа демонстрирует, что больницы могут совместно обучать высококачественный ИИ для поиска узелков, не отправляя при этом сканы пациентов по сети. Комбинируя тщательную предобработку изображений, модель, которая учитывает как детали, так и контекст, и стратегию обучения, настроенную на редкие цели, рамочная система надежно выделяет солидные узелки в реалистичной многопрофильной среде. Хотя требуется дальнейшая работа для обработки очень слабых или частично солидных узелков, исследование указывает путь к инструментам скрининга рака легкого, которые одновременно точны и сохраняют конфиденциальность — позволяя пациентам получать преимущества больших данных без компромисса в конфиденциальности их медицинских изображений.
Цитирование: Turjya, S.M., Fawakherji, M. Federated lung nodule segmentation using a hybrid transformer–U-Net architecture. Sci Rep 16, 5228 (2026). https://doi.org/10.1038/s41598-026-35243-9
Ключевые слова: скрининг рака легкого, сегментация медицинских изображений, федеративное обучение, узелки лёгких на КТ, ИИ с сохранением конфиденциальности