Clear Sky Science · zh
用于息肉分割的分层上下文信息聚合
为什么结肠中的小生长物很重要
结直肠癌通常始于大肠黏膜上的小而看似无害的凸起,称为息肉。在结肠镜检查期间,医生会尝试发现并切除这些生长物,以防其变得危险。但人会疲劳,视野并不总是理想,研究显示多达四分之一的息肉可能被漏检。本文提出了一种新的人工智能(AI)系统,旨在自动精确勾画结肠镜图像中的息肉,目标是成为一个可靠的助手,帮助医生看到更多、漏检更少。

既看森林也看树木
用于医学影像的现代 AI 工具通常分为两类。一类基于经典卷积神经网络,擅长识别细微的局部细节,例如微妙的边缘或纹理变化,但在理解图像中相距较远区域之间的关联上表现欠佳。另一类基于变换器(transformer)模型,擅长捕捉长程关系——能“看清”整幅图像的总体格局——但可能在像息肉这样细小结构的边界处失去清晰度,且计算成本较高。近期的混合系统试图融合这两种方法,然而它们常常偏向卷积部分,未能充分利用注意力机制,导致边缘模糊和上下文丢失。
在多尺度上结合线索的新方法
作者提出了一种称为分层上下文信息聚合(Hierarchical Contextual Information Aggregation,HCIA)的网络,以克服这些限制。HCIA 旨在同时从若干不同细节层次观察结肠镜图像——从粗略的广角视图到精细的放大视图——并以结构化方式让这些层级相互交流。其中一个关键组件是分层聚合模块(Hierarchical Aggregation Module,HAM),它融合来自相邻层级的信息。通过将粗糙的上下文与更细的细节混合,HAM 帮助系统将息肉与具有不同颜色、形状和大小的背景组织区分开来,同时在息肉与健康组织交界处提升边界的清晰度。
无需高昂计算的智能注意力
另一个关键模块是互联注意力模块(Interconnected Attention Module,IAM),它解决了全局上下文的挑战。IAM 并不以通常的方式计算注意力——即比较每个像素与每个其他像素,这会迅速导致高昂的计算开销——而是使用一个共享的“记忆”,总结网络在各层学到的信息。每个层级查询该记忆来决定其特征的哪些部分值得获得更多关注。这一设计使得 IAM 能在整个图像中建立长程连接,同时将计算成本控制在可接受范围内。更重要的是,该记忆在网络各分支之间共享,提供了一种一致的全局监督,有助于模型在不同大小或位置的息肉上保持关注。

将系统付诸考验
为验证 HCIA 的设计在实践中的效果,作者在三个广泛使用的息肉图像集上进行了测试,每个数据集包含数百到一千帧由专家标注的结肠镜图像。他们将 HCIA 与二十多种领先的 AI 模型进行了比较,这些模型既包含传统的卷积网络,也有较新的基于变换器的混合模型。在几乎所有评估指标上——预测息肉区域与专家标注的重叠程度、形状捕捉的准确性以及结构对齐的好坏——HCIA 均位列前茅或与最强的竞争者旗鼓相当。在跨数据集测试中表现尤为突出,这是一种严苛的评估情形,模拟了工具在不同医院、不同设备与成像条件下的实际应用情况。详细的可视化比较显示,HCIA 比竞争方法更可靠地捕捉了不规则的息肉形状和微弱的边界。
这对患者和临床医生意味着什么
对非专业读者而言,核心结论是 HCIA 是一个更准确地勾画结肠镜图像中潜在癌性生长物的 AI 系统,并且运行速度足够快,可用于实时应用。通过高保真的局部细节与强有力的整体语境相结合,且高效实现,HCIA 降低了微小或形状奇特的息肉被忽视的风险。尽管该模型仍需针对超轻量设备进一步优化,并且尚未利用随时间变化的视频序列信息,但它代表了朝着更智能、更可靠的结肠癌筛查计算机辅助方向迈出的重要一步——帮助医生在病变变得威胁生命前发现更多危险生长物。
引用: Li, L., Yang, H., Zhang, J. et al. Hierarchical contextual information aggregation for polyp segmentation. Sci Rep 16, 5959 (2026). https://doi.org/10.1038/s41598-026-35703-2
关键词: 结直肠息肉, 结肠镜人工智能, 医学图像分割, 深度学习, 早期癌症检测