Clear Sky Science · zh
用于生物医学数据的流形拓扑深度学习
看见医学影像下的模式
现代医院收集了大量扫描数据,从 X 光片到三维磁共振成像,我们依赖计算机来辅助医生解读。这项研究提出了一种新的人工智能查看医学图像的方式,它不仅关注像素值,还关注每幅图像中隐藏的形状和流动。目标是让计算机诊断更准确、可靠且更易解释。

从图片到光滑曲面
大多数图像分析系统将扫描视为平整的像素网格。作者认为,许多医学图像更适合作为在空间中弯曲起伏的光滑曲面来观察,类似鼓面或气球表面。在数学中,这类光滑形状称为流形。将图像视为流形而非简单网格,模型能够捕捉结构如何连接、在哪里形成回环以及不同区域如何以连续方式彼此关联的信息。
让流动揭示隐藏结构
为了深入这种流形视角,方法首先在每幅图像上构建一种流场,其中微小的箭头描述强度如何从一点变化到另一点。利用称为霍奇理论的一支数学工具,这个流可以被分解成三个相互独立的部分:一部分捕获源与汇,另一部分描述旋转模式,第三部分反映大尺度的全局结构。这三重视角将原始扫描变为更丰富的层次,每一层都强调解剖结构和组织模式的不同方面。

向小型网络提供更聪明的输入
经过这种数学重塑后,三种流分量被叠加并输入到一个小型、精心设计的卷积神经网络。与许多包含数千万可调权重的流行医学 AI 模型不同,该网络使用的参数远少于一百万。尽管体量紧凑,但由于输入已经按照形状与连通性组织好,网络不必从零发现这些模式,从而受益匪浅。作者在 MedMNIST v2 上测试了他们的系统——这是一个包含超过 70 万张生物医学图像的大型基准,涵盖二维与三维扫描、各种器官、成像设备与任务类型。
在多种数据上取得更强的结果
该新方法在几乎所有 17 个 MedMNIST 数据集中都优于领先的深度学习模型,包括二维切片和三维体数据。它在皮肤图像、眼部扫描、血细胞片和三维器官与神经元数据上表现尤为出色,常常显著提高准确率并更好地区分病变与健康病例。该模型在图像尺寸改变、训练样本数量多寡以及诊断类别数量变化时仍保持稳健。在不同分辨率的真实皮肤病变集合上的测试显示,随着细节增多性能提升,但即便在低分辨率下,其表现也优于竞争方法。
为何分解很重要
为检验数学分解是否确有帮助,作者使用几乎相同的网络重复实验,但跳过流形与流分解,直接使用原始图像。在所有情况下,带分解的版本表现更好,有时优势很明显。这表明基于三种流的视角捕获了关于局部纹理与全局形状的互补信息,是普通像素无法提供的,这些额外结构使网络更容易学习到稳定的模式。
读取医学图像的新方法
通俗地说,这项工作表明教会人工智能尊重医学图像中的底层形状与流动,可以带来更准确、更高效的基于图像的诊断工具。通过将几何与拓扑的思想与现代神经网络相结合,作者提供了一个能更好利用扫描中已有信息且模型相对较小的框架。这种流形拓扑深度学习方法有望帮助未来系统更可靠地解读复杂的生物医学图像,即便数据多样、有限或有噪声。
引用: Liu, X., Su, Z., Shi, Y. et al. Manifold topological deep learning for biomedical data. Nat Commun 17, 4710 (2026). https://doi.org/10.1038/s41467-026-71392-1
关键词: 医学成像人工智能, 深度学习, 拓扑数据分析, 图像分类, 生物医学数据