Clear Sky Science · zh

实例切换混合：一种应用于胃肠道病变检测的域特定数据增强方法

2026-03-04 · 返回目录

为何更智能的训练数据对肠道健康很重要

医生使用微小的摄像头观察我们的消化道，以发现疾病的早期迹象，例如可能发展为癌症的小型异常斑块。但这些警示信号往往极为微妙，可能帮助医生识别它们的计算机系统则需要数千张标注精良的图像来学习识别要点。本文提出了一种在计算机上“生成”逼真训练图像的新方法，从而更容易教会人工智能系统尽早检测这些难以察觉的病变。

隐藏的警示点的挑战

胃肠道中的病变——例如肠上皮化生、早期不典型增生和小息肉——是癌症的重要早期警示信号，但它们往往仅与健康组织有轻微差别。人工专家有时会遗漏它们，计算机模型也很难检测，主要因为缺乏足够多的高质量、精心标注的图像用于学习。收集和注释内镜图像既昂贵又耗时，并且在伦理上敏感，尤其是针对罕见病变类型。常见的用于扩大训练数据的技巧——如翻转、旋转或整体图像混合——在日常摄影中有用，但它们倾向于模糊或错置胃肠检查中最重要的细微细节和边界。

从粗糙的剪切粘贴到基于解剖学的混合

研究人员尝试了更高级的“剪切粘贴”方法，将可见病变从一张图像复制并放入另一张图像，或使用生成模型创造全新图像。尽管这些策略增加了多样性，但它们常常忽视周围解剖结构。被粘贴的病变可能出现在不真实的位置，或在颜色和纹理上与周围组织冲突，从而降低训练图像的可信度。像 GAN 和扩散网络这样的生成模型可以产生令人印象深刻的图像，但它们需要非常大的数据集、难以控制，并且可能捏造出真实病人中不存在的结构。对于依赖细微颜色变化和表面细节的任务——如早期胃肠疾病——这些缺点限制了现有增强方法的帮助效果。

一种将病变融入真实场景的新方法

作者提出了实例切换混合（Cut Instance Mixing，CIM），这是一种专门针对胃肠图像设计的域特定方法。CIM 不会随机放置病变，而是先分析一张健康图像，寻找类似真实黏膜模式的有意义区域。它通过聚类像素形成光滑、符合生物学的补丁，然后将这些补丁拆分为更小且整齐的子区域。接着，CIM 从另一张图像中选择一个真实病变，并搜索与该病变周围颜色和纹理最匹配的子区域。病变被置于该位置，并使用保留边缘和光照的混合技术进行平滑融合，同时通过一个称为 α 的调节参数控制病变出现的强度或微妙程度。结果是一张合成图像，其中病变看起来像自然在该处形成一样；由于原始病变标签已知，新图像可自动用于训练注释。

将该方法付诸检验

为检验 CIM 是否真正有效，团队在三种不同的内镜数据集上训练了相同的深度学习模型：肠上皮化生、不典型增生和结肠息肉。对于每个数据集，他们将 CIM 与诸如 MixUp、CutMix 和简单随机复制粘贴等标准技术进行比较，采用严格的交叉验证，并在息肉案例中使用来自其他医院的外部测试集。几乎在所有性能指标上——例如总体准确率、病变与健康组织的可分离能力以及重复测试的稳定性——CIM（尤其是在较强混合时，α 约为 0.8）均表现最佳。研究人员还检查了显示模型“注视”位置的热图。使用 CIM 训练的模型更精确地聚焦于真实病变区域，与医学注释更为一致，这表明 CIM 有助于网络学习更具临床意义的特征，而不是依赖捷径或噪声。

这对未来肠癌筛查意味着什么

简单来说，CIM 通过将真实病变以尊重解剖结构的方式插入可信的新位置，为医生的计算机提供了更多且更好的练习图像。该方法减少了常见与罕见病情之间的不平衡，加强了对早期和微妙疾病的检测，并且不依赖笨重、难以控制的生成模型或额外的辅助网络。尽管当前工作侧重于二元决策——有病变或无病变——相同策略可以扩展到多种病变类型并在其他器官系统中测试。如果被广泛采用，CIM 及类似的基于解剖学的数据“混合”工具可能使计算机辅助内镜更加可靠，帮助专家更早、更一致地发现消化道中的危险变化。

引用: Neto, A., Almeida, E., Libânio, D. et al. Cut instance mixing: A domain-specific data augmentation method applied to gastrointestinal lesion detection. Sci Rep 16, 11941 (2026). https://doi.org/10.1038/s41598-026-42138-2

关键词: 胃肠道病变, 内镜成像, 数据增强, 深度学习, 癌症筛查