Clear Sky Science · zh

通过形状-纹理解耦深度神经网络减小庞大的医学图像

2026-01-15 · 返回目录

为什么缩小医学图像很重要

现代医院会产生大量来自CT和MRI设备的详细三维扫描。这些图像对诊断和研究至关重要，但体积巨大：单个数据集就可能占据数百GB，使得存储、共享和分析既缓慢又昂贵。本文提出了一种新方法，能够在几乎不损失诊断细节的前提下显著缩小这些庞大文件，可能加速临床工作、远程会诊以及大规模医学研究。

一次扫描中的两类信息

查看身体扫描时，实际上同时看到两类不同的信息。第一类是器官和骨骼的整体形状——脊柱的弯曲位置、肝脏的大小、腹部的布局。第二类是细粒度的纹理——亮度的微小变化，提示组织类型或细微病变。作者指出，大多数现有压缩工具把这两种成分当作混合在一起处理，导致压缩既慢又低效。他们的关键思想是将形状与纹理分离，并分别用最适合各自的策略进行压缩。

基于模板的身体蓝图

该新方法称为形状-纹理解耦压缩（DeepSTD），首先为给定的身体区域和成像类型（如胸腹部CT或腹部MRI）选择一个“模板”扫描。该模板相当于该解剖区域的标准地图。针对每个新扫描，DeepSTD首先确定需要如何对该人的身体进行平滑变形以与模板对齐。该变形场描述了形状差异：例如一名患者更高、另一名患者肝脏位置略有偏移，或脊柱曲率不同。作者使用一种擅长编码平滑三维变形的紧凑神经网络来表示该变形场，从而能够高效存储形状信息。

对齐后捕捉细微纹理

一旦扫描被变形以匹配模板的形状，剩下的主要是纹理差异——区分患者的微妙强度模式。由于所有扫描都处于相同的几何布局，这些纹理更容易建模和压缩。DeepSTD将对齐后的数据输入第二个神经网络，该网络在完整三维上将卷积层（擅长局部细节）与Transformer模块（擅长捕捉长距离结构）混合。这个网络从大量样本中学习哪些纹理细节是常见的、哪些是独特的，从而只在紧凑的“潜码”中存储必要信息。最终压缩文件仅包含形状码和纹理码。

在真实CT与MRI集合上的测试

团队在大型公开数据集上测试了DeepSTD，包括详细的脊柱CT扫描和腹部MRI体积数据。他们将其与传统工具（如JPEG、HEVC和较新的视频标准）以及最先进的神经方法进行了对比。在高达将原始文件压缩至256倍的压缩率下，DeepSTD在保持像素级相似性和医学重要特征（例如自动器官分割）方面明显优于其他方法。与此同时，它比仅基于隐式神经表示的先前最佳神经压缩系统编码速度快了数十到上百倍。在实际意义上，使用DeepSTD，一个曾经在慢速连接上需要几天下载的CT数据集，现在可在不到半小时内传输，且几乎没有可见损失。

为日常临床使用而设计

除了原始性能指标外，作者在设计DeepSTD时考虑了现实世界的约束。该方法可以并行使用多张显卡，进一步缩短大规模集合的编码和解码时间。它允许对压缩比进行精确控制，使医院能够根据可用存储或网络带宽匹配文件大小。由于采用了巧妙的数据增强和“知识蒸馏”技术（将从更丰富数据集中学到的内容迁移过来），该系统在训练数据有限时也能发挥作用。对额外的胸片以及脑和膝盖MRI的测试表明该方法在不同成像类型间具有广泛适用性。

这对患者和医生意味着什么

对于非专业读者，结论很简单：DeepSTD是一种更聪明的医学图像压缩方式。通过分别编码患者身体的形状与组织的外观，它能将扫描文件压缩超过百倍，同时保留医生和算法依赖的信息。这将大大简化长期影像记录的存储、医院之间的数据共享以及开展大规模AI研究的难度，且不会牺牲诊断质量。

引用: Yang, R., Xiao, T., Cheng, Y. et al. Reducing bulky medical images via shape-texture decoupled deep neural networks. Nat Commun 17, 1573 (2026). https://doi.org/10.1038/s41467-026-68292-9

关键词: 医学图像压缩, 深度学习, CT与MRI数据, 神经表征, 健康数据存储