Clear Sky Science · ru
Уменьшение объёма медицинских изображений с помощью глубоких нейросетей с раздельным кодированием формы и текстуры
Почему важно уменьшать объём медицинских изображений
В современных больницах создаётся огромное количество детализированных 3D‑сканов с КТ и МРТ. Эти изображения необходимы для диагностики и исследований, но они занимают очень много места: один набор данных может занимать сотни гигабайт, что делает их хранение, передачу и анализ медленными и дорогими. В статье предлагается новый подход, который позволяет существенно уменьшить такие объёмы при почти полном сохранении диагностической информации, что может ускорить клиническую работу, удалённые консультации и крупномасштабные медицинские исследования.
Два типа информации в одном скане
Когда вы смотрите на скан тела, вы на самом деле видите два разных слоя информации одновременно. Первый — это общая форма органов и костей: где изгибается позвоночник, какой размер печени, расположение органов в брюшной полости. Второй — мелкомасштабная текстура: тонкие вариации яркости, которые указывают на тип ткани или едва заметные патологии. Авторы утверждают, что большинство существующих инструментов сжатия обращаются с этими ингредиентами как с единым целым, что замедляет и ухудшает сжатие. Ключевая идея — разъединить форму и текстуру и сжимать каждую компоненту подходящим способом.

Шаблон как план строения тела
Новый метод, названный Shape-Texture Decoupled Compression (DeepSTD), начинается с выбора «шаблона» для данной области тела и типа исследования, например торсовой КТ или абдоминальной МРТ. Этот шаблон выступает как стандартная карта анатомии. Для каждого нового скана DeepSTD сначала определяет, как гладко деформировать тело пациента, чтобы совместить его с шаблоном. Это поле деформации описывает различия в форме: один пациент может быть выше, у другого печень смещена, у третьего иной изгиб позвоночника. Авторы представляют это поле деформации с помощью компактной нейросети, хорошо подходящей для кодирования гладких 3D‑деформаций, что позволяет эффективно хранить информацию о форме.
Фиксация тонкой текстуры после выравнивания
После приведения скана к форме шаблона остаются в основном различия текстуры — тонкие паттерны интенсивности, отличающие одного пациента от другого. Поскольку теперь все сканы имеют одинаковую геометрию, моделировать и сжимать эти текстуры проще. DeepSTD подаёт выровненные данные во вторую нейросеть, которая сочетает свёрточные слои (хороши для локальных деталей) и блоки Transformer (хороши для захвата долгосрочной структуры) во всей 3D‑пространственности. Эта сеть на основе большого числа примеров учится, какие текстурные детали типичны, а какие уникальны, позволяя сохранять только существенное в компактном «латентном коде». Итоговый сжатый файл состоит из кода формы и кода текстуры.
Тестирование на реальных наборах КТ и МРТ
Исследователи проверили DeepSTD на больших публичных наборах данных, включая подробные КТ позвоночника и объёмы абдоминальной МРТ. Они сравнили его с традиционными инструментами (например, JPEG, HEVC и новыми видео‑стандартами) и с современными нейронными методами. При уровнях сжатия до 256 раз по сравнению с исходными файлами DeepSTD сохранял как пиксельное сходство, так и медицински важные признаки, например автоматические сегментации органов, значительно лучше, чем альтернативы. При этом кодирование происходило в десятки и более сотни раз быстрее, чем у лучшей предшествующей нейросетевой системы, основанной только на неявных нейронных представлениях. Практически это означает, что набор КТ, который раньше передавался по медленному соединению днями, с DeepSTD можно переслать менее чем за полчаса практически без видимых потерь.

Создано для повседневного клинического использования
Помимо сырых показателей, авторы проектировали DeepSTD с учётом реальных ограничений. Метод может использовать несколько графических процессоров параллельно, сокращая время кодирования и декодирования для больших коллекций. Он даёт точный контроль над коэффициентом сжатия, так что больницы могут подгонять размер файлов под доступное хранилище или пропускную способность сети. Система также работает при ограниченных обучающих данных благодаря умной аугментации данных и техникам «дистилляции знаний», которые переносят приобретённые знания с больших наборов. Тесты на дополнительных рентгенах грудной клетки, а также на МРТ головы и колена показали, что подход применим в разных типах изображений.
Что это значит для пациентов и врачей
Для неспециалиста вывод прост: DeepSTD — это более умный способ упаковать медицинские изображения. Раздельно кодируя форму тела пациента и вид его тканей, метод уменьшает объёмы сканов более чем в сто раз, при этом сохраняя информацию, на которую опираются врачи и алгоритмы. Это может значительно упростить долгосрочное хранение изображений, обмен данными между клиниками и проведение масштабных исследований с использованием ИИ — и всё это без ущерба для диагностического качества.
Цитирование: Yang, R., Xiao, T., Cheng, Y. et al. Reducing bulky medical images via shape-texture decoupled deep neural networks. Nat Commun 17, 1573 (2026). https://doi.org/10.1038/s41467-026-68292-9
Ключевые слова: сжатие медицинских изображений, глубокое обучение, данные КТ и МРТ, нейронное представление, хранение медицинских данных