Clear Sky Science · zh

用于息肉分割的分层上下文信息聚合

2026-01-14 · 返回目录

为什么结肠中的小生长物很重要

结直肠癌通常始于大肠黏膜上的小而看似无害的凸起，称为息肉。在结肠镜检查期间，医生会尝试发现并切除这些生长物，以防其变得危险。但人会疲劳，视野并不总是理想，研究显示多达四分之一的息肉可能被漏检。本文提出了一种新的人工智能（AI）系统，旨在自动精确勾画结肠镜图像中的息肉，目标是成为一个可靠的助手，帮助医生看到更多、漏检更少。

既看森林也看树木

用于医学影像的现代 AI 工具通常分为两类。一类基于经典卷积神经网络，擅长识别细微的局部细节，例如微妙的边缘或纹理变化，但在理解图像中相距较远区域之间的关联上表现欠佳。另一类基于变换器（transformer）模型，擅长捕捉长程关系——能“看清”整幅图像的总体格局——但可能在像息肉这样细小结构的边界处失去清晰度，且计算成本较高。近期的混合系统试图融合这两种方法，然而它们常常偏向卷积部分，未能充分利用注意力机制，导致边缘模糊和上下文丢失。

在多尺度上结合线索的新方法

作者提出了一种称为分层上下文信息聚合（Hierarchical Contextual Information Aggregation，HCIA）的网络，以克服这些限制。HCIA 旨在同时从若干不同细节层次观察结肠镜图像——从粗略的广角视图到精细的放大视图——并以结构化方式让这些层级相互交流。其中一个关键组件是分层聚合模块（Hierarchical Aggregation Module，HAM），它融合来自相邻层级的信息。通过将粗糙的上下文与更细的细节混合，HAM 帮助系统将息肉与具有不同颜色、形状和大小的背景组织区分开来，同时在息肉与健康组织交界处提升边界的清晰度。

无需高昂计算的智能注意力

另一个关键模块是互联注意力模块（Interconnected Attention Module，IAM），它解决了全局上下文的挑战。IAM 并不以通常的方式计算注意力——即比较每个像素与每个其他像素，这会迅速导致高昂的计算开销——而是使用一个共享的“记忆”，总结网络在各层学到的信息。每个层级查询该记忆来决定其特征的哪些部分值得获得更多关注。这一设计使得 IAM 能在整个图像中建立长程连接，同时将计算成本控制在可接受范围内。更重要的是，该记忆在网络各分支之间共享，提供了一种一致的全局监督，有助于模型在不同大小或位置的息肉上保持关注。

将系统付诸考验

为验证 HCIA 的设计在实践中的效果，作者在三个广泛使用的息肉图像集上进行了测试，每个数据集包含数百到一千帧由专家标注的结肠镜图像。他们将 HCIA 与二十多种领先的 AI 模型进行了比较，这些模型既包含传统的卷积网络，也有较新的基于变换器的混合模型。在几乎所有评估指标上——预测息肉区域与专家标注的重叠程度、形状捕捉的准确性以及结构对齐的好坏——HCIA 均位列前茅或与最强的竞争者旗鼓相当。在跨数据集测试中表现尤为突出，这是一种严苛的评估情形，模拟了工具在不同医院、不同设备与成像条件下的实际应用情况。详细的可视化比较显示，HCIA 比竞争方法更可靠地捕捉了不规则的息肉形状和微弱的边界。

这对患者和临床医生意味着什么

对非专业读者而言，核心结论是 HCIA 是一个更准确地勾画结肠镜图像中潜在癌性生长物的 AI 系统，并且运行速度足够快，可用于实时应用。通过高保真的局部细节与强有力的整体语境相结合，且高效实现，HCIA 降低了微小或形状奇特的息肉被忽视的风险。尽管该模型仍需针对超轻量设备进一步优化，并且尚未利用随时间变化的视频序列信息，但它代表了朝着更智能、更可靠的结肠癌筛查计算机辅助方向迈出的重要一步——帮助医生在病变变得威胁生命前发现更多危险生长物。

引用: Li, L., Yang, H., Zhang, J. et al. Hierarchical contextual information aggregation for polyp segmentation. Sci Rep 16, 5959 (2026). https://doi.org/10.1038/s41598-026-35703-2

关键词: 结直肠息肉, 结肠镜人工智能, 医学图像分割, 深度学习, 早期癌症检测