Clear Sky Science · zh

PrysmNet:一种使用显著性和多模态引导以实现可复现跨域分割的息肉精化系统

· 返回目录

为何发现微小病变至关重要

结直肠癌通常起源于结肠黏膜上的小而看似无害的隆起,称为息肉。及早发现并切除这些息肉可以阻止癌变,但即便是经验丰富的医生在结肠镜检查中也会漏诊相当一部分息肉,尤其是当病变很小或边缘不清时。本研究提出了PrysmNet——一种新的人工智能(AI)系统,旨在帮助医生在不同医院、不同摄像设备和不同患者群体间更可靠地发现并描绘息肉,同时保持足够的速度以支持检查过程中的实时使用。

为结肠镜检查提供更智能的辅助

PrysmNet 是一种计算机视觉系统,它以结肠镜图像为输入,输出显示哪些像素属于息肉的细致图谱。与许多早期只在其训练图像类型上表现良好的工具不同,该系统被设计为在遇到新的设备、光照和患者群体时仍能保持准确性。它采用了现代的“Transformer”骨干网络——这种最初为语言处理开发、现今在图像分析中流行的 AI 架构——以整体视野同时观察场景并推断息肉位置,即便息肉只占画面的一小部分或与周围组织颜色相近。

Figure 1
Figure 1.

借鉴人类视觉的技巧

PrysmNet 的一项关键创新是引入了一个以我们视觉系统如何检测边缘和对比为灵感的边界聚焦模块。作者增加了一个“显著性模块”,它在多个尺度上扫描图像特征以突出强度和纹理发生剧烈变化的区域,这些区域常与息肉边界对应。网络不是平等对待所有区域,而是被引导集中精力在这些边界上,从而锐化其描绘的轮廓。这对于平坦或低对比的息肉尤为重要,因为这类息肉的边界既容易被人类忽视,也容易被机器漏检。通过在训练期间对该模块进行已知息肉边缘的显式监督,系统学会绘制更清晰、更具临床价值的掩模。

借大规模模型之力并利用额外线索

为进一步提高鲁棒性,研究人员让 PrysmNet 向一个更大且通用的分割模型——“Segment Anything Model”学习,该模型曾在来自日常照片的超过十亿个对象轮廓上训练。在训练过程中,他们在相同的结肠镜图像上同时运行两个系统,并鼓励 PrysmNet 模仿大型模型的整体形状、边界和内部特征,同时仍然遵循专家绘制的医学标签。与此同时,他们通过一个临时的引导分支输入每帧的简单额外视图——边缘图和纹理模式。这些额外信息帮助网络对颜色或光照的变化不那么敏感。关键在于,这些引导部分在训练完成后会被关闭,因此最终系统保持轻量且速度快,适合在真实临床中使用。

Figure 2
Figure 2.

在真实世界中证明其有效性

团队在若干广泛使用的息肉图像集合上测试了 PrysmNet,包括在其训练环境内的测试以及更具挑战性的来自不同医院和摄像系统的数据。在标准基准上,该模型的准确性与现有最佳方法相当或略有超越。更引人注目的是“跨域”测试:PrysmNet 仅在两个数据集上训练,然后在第三个独立的多中心数据集上评估。此处它在重叠评分上表现更高,且边界明显更清晰,优于先前系统,包括一个专门针对息肉边缘调优的强劲近期竞争模型。并列的可视化示例显示,PrysmNet 更能捕捉微小和低对比的息肉,其注意力图集中在真实病变边界而非扩散开来。

尚存的挑战及其对患者的意义

尽管取得了进展,PrysmNet 并非完美。它仍可能被类似组织的强反光误导,有时会漏检极度平坦或几乎不可见的病变。这类失败在测试中很少见——大约占几百分点——但它们强调了 AI 应被视为有力的助手而非替代有经验的内镜医师。总体而言,这项工作表明,将具备全局感知的 AI 骨干与边界感知的精化模块及智能训练引导相结合,可以使计算机辅助结肠镜检查更可靠。如能安全集成到内镜系统中,像 PrysmNet 这样的工具可能帮助医生发现更多危险息肉、划定更清晰的切除边界,并最终降低患者的结直肠癌风险。

引用: Xiao, J., Han, Y., Wang, L. et al. PrysmNet a polyp refining system using salience and multimodal guidance for reproducible cross domain segmentation. npj Digit. Med. 9, 158 (2026). https://doi.org/10.1038/s41746-026-02345-7

关键词: 结肠镜 AI, 息肉检测, 医学图像分割, 结直肠癌预防, 内镜学中的深度学习