Clear Sky Science · zh
基于 YOLOv12 的方法用于在二维侧位颅骨 X 光片上自动检测头影测量标志点
为什么在颅骨 X 光片上识别微小点很重要
当正畸医生制定牙套、颌骨手术或面部不对称的治疗方案时,他们依赖于从头部侧位 X 光片上获得的详细测量。这些测量依赖于分布在颅骨和面部各处的数十个微小解剖参考点。如今,许多这些点仍由人工标注,这一过程既缓慢又存在一定主观性。本研究探讨了一种现代人工智能(AI)系统——基于流行的 YOLO 图像检测家族的先进版本——如何自动在颅骨 X 光片上定位这些关键标志点,旨在使正畸护理更快、更一致并更易获取。
从仔细描记到自动化指引
近一个世纪以来,“头影测量分析”一直是正畸诊断的基石。临床医生查看标准化的侧位 X 光片并在颅骨和软组织的特定位置标记点——包括下颌、牙齿、鼻子、唇部和颅底。从这些坐标计算角度和距离以指导治疗决策。人工完成这一过程每张 X 光片通常需 10–15 分钟,即使是经验丰富的专家之间也可能存在几毫米的差异,而这些差异会影响精细的治疗方案。随着牙科诊所接待更多患者并追求更高精度,存在越来越大的压力去加快这项工作并减少人为差异,同时不失去专家的把关。
现代 AI 如何“看” X 光片
近年来,尤其是深度学习方面的进展,改变了计算机解读影像的方式。与依靠手工设计规则不同,深度神经网络直接从大量带标签的样本中学习。在医学影像领域,一类称为卷积神经网络的模型尤为成功,因为它能够自动发现从简单边缘到复杂解剖形态的模式。在这类方法中,“You Only Look Once”(YOLO)家族因能够极快且一次性地识别图像中的目标而突出。最新一代 YOLOv12 融入了注意力机制和多尺度处理,这些特性对寻找像头影测量标志点这样的小且密集的结构尤为有利。

构建更聪明的标志点检测器
作者将两个公开可用的侧位颅骨 X 光图像集合合并,总计略少于 500 张图像,每张图像均由经验丰富的临床医生标注了 19 个重要的头影测量标志点。他们将图像转换为更紧凑的格式,并将每个标志点坐标转换为以该点为中心的小方框,以便设计用于检测方框对象的 YOLOv12 能将每个标志点视为微小目标。借助名为 Roboflow 的平台,他们去除了重复图像并应用了适度的变换,例如轻度旋转、亮度变化和噪声。这些变换有效地将训练图像数量扩增了约三倍,帮助模型在图像质量和患者解剖差异方面变得更加鲁棒。
AI 的训练与测试细节
研究人员在一块强大的图形处理器上对大型 YOLOv12 模型进行了 50 个训练轮(epoch)。在训练过程中,模型的内部层学会将原始 X 光片转换为一组突出重要区域的特征,输出“头部”则学会在每个标志点周围绘制小方框并为其分配置信度分数。训练完成后,模型在 94 张此前未见过的 X 光片上进行了测试。为评估性能,团队测量了每个预测标志点与专家标注点之间的距离,还分析了精度-召回曲线、不同标志点间的混淆模式,以及显示特定点一致性的详细图示。
AI 做对了什么——以及它在哪些方面挣扎
总体而言,该系统约有一半的标志点在与专家标注相距 1 毫米范围内被找到,略超过 80% 在 2 毫米范围内——这一范围对许多临床任务被视为可接受。模型在具有清晰形状与高对比度的标志点上表现优异,例如蝶鞍(Sella)、颏点(Gnathion)、颏尖(Menton)以及某些与牙齿相关的点,超过四分之三的预测在 1 毫米内,超过 93% 在 2 毫米内。模型在区分下巴和前牙附近的紧密簇状点上也出乎意料地表现良好,表明它学到了细微的空间关系,而不仅仅是孤立的像素。不过,它在一些模糊区域表现欠佳,如下颌角(Gonion)、上前突点(Subspinale)、眶下缘(Orbitale)、关节点(Articulare)和耳孔(Porion)。这些区域即使对人类也更难判断,因为骨骼重叠和低对比度使边界不清,再加上低质量 X 光会进一步降低准确性。

这对未来正畸护理意味着什么
作者得出的结论是,他们基于 YOLOv12 的系统尚不足以取代人类专家,但它作为半自动头影测量分析的概念验证已相当有力。在实践中,此类工具可以快速放置初步标志点,供临床医生随后微调,从而将 AI 的速度与一致性与专业判断相结合。随着规模更大、更多样化的训练数据集、对低质量图像更好的处理方法以及模型的持续改进,未来版本可能接近真正的临床级性能。如果达到这一点,正畸医生可能很快会减少手工描记 X 光片的时间,而将更多精力用于利用这些测量制定个性化治疗方案。
引用: Akre, P.D., Ghavghave, Y.G. & Pacharaney, U. A YOLOv12-based approach for automatic detection of cephalometric landmarks on 2D lateral skull X-ray images. Sci Rep 16, 12837 (2026). https://doi.org/10.1038/s41598-026-43250-z
关键词: 头影测量分析, 正畸影像学, 深度学习, 标志点检测, YOLOv12