Clear Sky Science · zh

基于像素级注释的多焦点口腔全景X光图像数据集

· 返回目录

为何重新审视牙科X光至关重要

我们许多人只有在坐在牙医椅上时才会想到牙科X光,但那些灰暗的影像中隐藏着关于牙龈疾病、龋齿以及影响全球数十亿人的其他问题的重要线索。本文介绍了ToothPix——一个精心准备的大规模牙科全景X光图像集合,旨在帮助计算机学习解读这些影像。通过将常规牙科影像转变为共享的丰富资源,这项工作旨在让未来的检查更快、更准确并更广泛可用。

Figure 1
Figure 1.

潜伏在口腔中的全球负担

口腔疾病是全球最常见的健康问题之一,从龋齿到晚期牙周病不等。牙医通常依靠目视检查和经验来判断X光片上的信息,这一过程可能会遗漏微妙的警示信号,并且不同临床医生之间存在差异。与此同时,深度学习系统在解读某些类型的医学影像方面已开始匹敌甚至超越人类专家。要将类似进展带入牙科领域,研究者需要大量真实世界的X光片,这些影像需被清晰且一致地标注出病变所在。直到现在,这类数据集一直稀缺、规模小且常常结构不良。

构建口腔的丰富图景

ToothPix项目旨在填补这一空白,收集了来自中国一家医院、年龄在4至80岁的患者的8,655张全景牙科X光片。全景X光通过在头部周围以弧线扫动窄束射线来一次性捕捉所有牙齿、颌骨及周围结构的广阔二维图像。ToothPix中的图像以高分辨率拍摄并保留原始尺寸,以保留对诊断至关重要的微小特征。它们还涵盖了各种真实成像条件,如不同的亮度和对比度,使基于这些图像训练的计算模型不太容易被设备或患者摆位差异所干扰。

将原始扫描转换为供计算机学习的材料

收集影像只是第一步。团队仔细删除了文件中存储的所有个人信息,并将扫描图像转换为广泛使用的图像格式,以便在医院系统外打开和分析而不暴露隐私数据。接着进行了严格的质量检查:专家筛查图像是否存在结构缺失、记录重复或曝光不足等问题,并使用一种在清晰度与辐射剂量之间平衡的标准量表进行评分。值得注意的是,所有图像都达到了或超过可接受质量的阈值,因此无需被丢弃。这意味着最终数据集提供了病人口腔的一致清晰视图,这是可信赖计算分析的基础。

手工勾画病变边界

要教算法识别目标,研究者需要的不仅是原始图片,而是病变出现位置的详细地图。二十位具有多年临床经验的牙科影像专家使用专用标注软件,在每张图像上手工描绘了牙齿与病变区域的轮廓。这些费时的像素级描绘在同一张影像上标注了多种常见情况,从龋齿到阻生牙。之后,这些轮廓被转换为与每张X光完全配对的颜色编码掩膜图像,文件按照简单的文件夹结构组织,方便其他研究者无需额外清理即可将其直接插入自己的程序中。

Figure 2
Figure 2.

对数据集进行实测

为了验证ToothPix是否真正对人工智能有用,作者对图像和手工标注都进行了评估。一个五项评分系统检查了牙齿与背景之间的对比度、图像清晰度、干扰伪影以及注释对牙齿边界的完整性和精确度。在这些度量上,数据集得分接近最高值,表明图像和标注都清晰可靠。团队随后在ToothPix上训练了若干流行的图像分割模型,并测量它们自动勾画病变区域的能力。虽然不同病种的表现有所差异,但结果表明该数据集可以支持现代深度学习方法,并在识别阻生牙等关键任务上呈现出有前景的准确度。

这对未来牙科就诊意味着什么

通俗地说,ToothPix就像一本组织良好的、由专家标注的牙科X光图书馆,任何合格的研究者都可以用来教计算机如何解读影像。尽管仍有局限——一些罕见病种仍然样本不足,图像来自单一医院,并且仅包含一种扫描类型——但这项工作奠定了坚实基础。随着类似数据集的增长并扩展到更多门诊和成像方法,它们有望帮助将更快速、更一致、更早期的牙科问题检测带给全球患者,支持而非取代牙医,并使那张熟悉的X光影像成为保护我们健康的更强大工具。

引用: Cui, J., Gu, J., Guan, Y. et al. A multi-focus oral panoramic x-ray image dataset based on pixel-level annotations. Sci Data 13, 693 (2026). https://doi.org/10.1038/s41597-026-07021-9

关键词: 牙科X光, 医学影像数据集, 牙科中的人工智能, 病变分割, 计算机辅助诊断