Clear Sky Science · zh

InfoColon:用于结肠镜连续信息帧的数据集

· 返回目录

为什么更清晰的结肠视频很重要

结肠镜检查是医生发现结直肠癌早期迹象的主要工具之一,但它生成的视频常常很杂乱。许多帧模糊、被气泡或器械遮挡,或只是显示一面空白的组织壁。这些无用的时刻会拖慢医生的速度,并使旨在协助医生的计算机程序产生混淆。该研究引入了 InfoColon,这是一个新的共享结肠镜视频集合,旨在将有用视图与无用视图分离,并帮助构建更智能、更可靠的医学人工智能系统。

清理嘈杂的医学视频流

在结肠镜检查过程中,相机穿过一个弯曲、潮湿且在运动的器官。随着医生推进或撤回镜身,画面可能抖动、起雾,或被光照眩光充满。作者指出,这类无信息帧会使发现息肉变得更难,增加临床医生的疲劳,并延长患者的检查时间。他们认为,能够快速挑出信息量大的帧——那些能清晰看到结肠内腔及其结构的帧——将改善诊断、允许自动质量检查,并支持诸如结肠三维地图和导航辅助等新工具。然而直到现在,还没有用于训练和比较此类方法的大型公共数据集。

Figure 1. 如何将清晰的结肠镜帧从杂乱帧中分离出来,以支持更好的分析和结肠三维视图。
Figure 1. 如何将清晰的结肠镜帧从杂乱帧中分离出来,以支持更好的分析和结肠三维视图。

一个新的结肠视图共享库

研究人员通过将两所医院的真实结肠镜视频与多个知名的公开图像集合结合,构建了 InfoColon。从医院检查中,他们以每秒采样一帧的方式收集了超过 119,000 帧,然后又添加了来自现有研究数据集的数万帧。每一帧均由内镜专家标注为信息性帧,或属于六类无信息帧之一:纯墙面、气泡、模糊、光照不良、器械遮挡,或其它障碍物如粪便。对部分帧的抽样检查显示专家之间一致性很高,从而增强了标签的可靠性。除了视频外,团队还提供了摘要报告,展示了每次操作中信息性帧随时间的分布情况。

教计算机专注于重要内容

手工标注如此大量的帧成本高且耗时,因此团队测试了可用较少标注样本充分学习的策略。他们比较了标准的监督学习与半监督和主动学习方法,后者仅请求专家标注最有帮助的新样本。他们的新方法称为基于准确率驱动的自适应阈值 BALD(Accuracy Driven Adaptive Threshold BALD),它基于模型性能变化的程度来选择供专家审阅的帧,而不仅仅是基于不确定性。使用现代视觉变换器模型,他们表明该方法在几种标签设置下都能以远少于传统训练所需的专家标注图像数量,达到区分信息性与无信息帧的高准确率。

从平面视频帧到三维地图

InfoColon 不仅列出哪些帧清晰。该数据集还包含相机校准视频和用于校正结肠镜广角畸变的参数。掌握这些信息后,作者仅使用信息性帧测试了可将二维图像转换为结肠表面三维点云的三维重建方法。在示例片段中,生成的三维模型捕捉到了褶皱、弯曲和纹理等重要形状,并显示出帧与帧之间的平滑过渡。这表明,经过良好过滤的帧流可以支持未来用于引导镜身、估计覆盖范围或帮助发现遗漏区域的工具。

Figure 2. 有多少杂乱的结肠镜帧被过滤为清晰视图,这些视图用于构建简单的结肠三维形状。
Figure 2. 有多少杂乱的结肠镜帧被过滤为清晰视图,这些视图用于构建简单的结肠三维形状。

这对患者和研究人员意味着什么

对外行人而言,InfoColon 可以被看作一个经过精心组织的库,它保留清晰图像并标注无用图像,同时记录相机的行为。这个共享资源应能让全球研究人员更容易构建和公平比较用于清理、分析或重建结肠镜视频的计算机程序。从长远看,这类进展可能在不改变患者检查流程的前提下,为医生提供更好的质量检查和更具信息量的结肠视图。

引用: Choi, T., Moon, H.S., Jang, S. et al. InfoColon: A dataset for consecutive informative frames in Colonoscopy. Sci Data 13, 748 (2026). https://doi.org/10.1038/s41597-026-07060-2

关键词: 结肠镜, 医学影像, 视频分析, 数据集, 主动学习