Clear Sky Science · zh

使用 EndoStyle 对胃肠镜图像进行风格迁移以改进人工智能预测模型

2026-04-28 · 返回目录

为结肠癌筛查提供更清晰的计算机辅助

结肠镜检查可以通过发现并切除称为息肉的小病变，在其发展为癌症之前挽救生命。如今许多医院使用人工智能（AI）来帮助医生在视频屏幕上识别这些微小病灶。但当 AI 工具从一家医院迁移到另一家时，经常会出现问题，因为不同的摄像系统使图像看起来略有差异。本研究提出了一种新方法，称为 EndoStyle，它能够重塑结肠镜图像，使 AI 系统在不同设备之间表现得更稳定可靠。

为什么内镜图像看起来不尽相同

对患者来说结肠镜检查可能看起来相同，但各个诊所使用的录像处理器和摄像头各不相同。这些设备在色调、亮度、对比度、锐度，甚至屏幕上圆形图像的大小和位置上都有差异。对于在一家医院训练的 AI 系统来说，这种“域迁移”可能是个巨大冲击：新图像不再与其所学匹配，准确性可能下降。当前常用的修正手段——例如翻转、旋转或略微调整亮度——并不能再现不同视频系统的独特视觉风格。因此，商业 AI 助手通常针对特定硬件进行调优，迁移到其他环境时效果可能欠佳。

教会图像匹配本地摄像风格

研究人员设计 EndoStyle 来充当内镜系统之间的数字“翻译器”。它接收一帧结肠镜图像和一个目标“风格”（例如某种特定录像处理器的视觉外观），并生成一张新图像，保留解剖结构和任何息肉，但将整体外观改为匹配目标设备。在内部，EndoStyle 结合了强大的图像翻译网络和用于增强细节的超分辨率模型，以提升最终输出的清晰度。特殊的保护机制确保重要特征（如肠壁皱襞和微妙的扁平息肉）得到保留，而不会被抹去或误生出伪像。

检验合成图像是否看起来真实

为了测试 EndoStyle 生成的合成图像是否可信，团队首先使用计算机视觉指标将其与真实结肠镜图像进行比较，这些指标衡量视觉真实感和感知相似性。在五种不同的视频处理器和数十万帧图像上，转换后的图像在整体外观和细节纹理上都与真实图像高度一致。三种独立训练的医学影像 AI 模型也判断这些新图像在保留原始内容的同时达到了目标设备的风格匹配。随后，来自 16 个中心的 22 名经验丰富的内镜医师参与了一项盲法实验。他们观看短片结肠镜视频并查看若干静帧，其中有些是真实的，有些由 EndoStyle 生成。医生们被要求判断哪些图像来自同一次检查。他们几乎同样经常将 EndoStyle 图像判断为真实帧，且远多于明显不匹配的情况，这表明合成图像通过了现实世界的“嗅觉测试”。

帮助 AI 找到真正的息肉并忽略噪声

作者接着考察这些逼真且风格匹配的图像是否能实际改善 AI 的息肉检测能力。他们在包含公共结肠镜图像和经 EndoStyle 生成、调整为匹配两款测试视频中使用的特定 Olympus 处理器风格的帧的混合数据上训练了若干检测系统。他们还测试了更具挑战性的情况：原始训练数据来自另一个厂家（富士胶片），这是 EndoStyle 在自身训练中未见过的品牌。在这两种情形下，加入针对目标处理器调校的合成图像使 AI 模型更具选择性：误报率大约下降了四分之一到四成以上，具体取决于设置，而灵敏度——即检测到真实息肉的频率——仅略有下降。重要的是，合成图像并未引入伪息肉，且少数漏诊的病灶大多对基线 AI 和商业工具来说本就具有较高难度。

这对患者和诊所可能意味着什么

研究表明可以生成现实且处理器特定的合成图像，并安全地用于训练检测算法，这为使结肠镜 AI 更具可移植性和可靠性提供了实用路径。与其在每次诊所升级或更换设备时收集并标注大量新数据，开发者可以使用 EndoStyle 将现有图像集合适配到新设备风格，并以更少的额外步骤重新训练系统。直接收益是 AI 的误报更少，同时仍能捕捉到大多数重要息肉，从而减少对内镜医师的干扰并提高信任度。随着时间推移，这类风格迁移方法可能有助于在医院间标准化 AI 性能，促进更好的癌症预防，并为未来医生提供更逼真的训练模拟器。

引用: Troya, J., Kafetzis, I., Weber, R. et al. Gastrointestinal endoscopic image style transfer using EndoStyle to improve artificial intelligence prediction models. npj Digit. Med. 9, 340 (2026). https://doi.org/10.1038/s41746-026-02693-4

关键词: 结肠镜检查, 息肉检测, 医学影像人工智能, 风格迁移, 域迁移