Clear Sky Science · zh

基于 YOLOv12 的方法用于在二维侧位颅骨 X 光片上自动检测头影测量标志点

2026-03-10 · 返回目录

为什么在颅骨 X 光片上识别微小点很重要

当正畸医生制定牙套、颌骨手术或面部不对称的治疗方案时，他们依赖于从头部侧位 X 光片上获得的详细测量。这些测量依赖于分布在颅骨和面部各处的数十个微小解剖参考点。如今，许多这些点仍由人工标注，这一过程既缓慢又存在一定主观性。本研究探讨了一种现代人工智能（AI）系统——基于流行的 YOLO 图像检测家族的先进版本——如何自动在颅骨 X 光片上定位这些关键标志点，旨在使正畸护理更快、更一致并更易获取。

从仔细描记到自动化指引

近一个世纪以来，“头影测量分析”一直是正畸诊断的基石。临床医生查看标准化的侧位 X 光片并在颅骨和软组织的特定位置标记点——包括下颌、牙齿、鼻子、唇部和颅底。从这些坐标计算角度和距离以指导治疗决策。人工完成这一过程每张 X 光片通常需 10–15 分钟，即使是经验丰富的专家之间也可能存在几毫米的差异，而这些差异会影响精细的治疗方案。随着牙科诊所接待更多患者并追求更高精度，存在越来越大的压力去加快这项工作并减少人为差异，同时不失去专家的把关。

现代 AI 如何“看” X 光片

近年来，尤其是深度学习方面的进展，改变了计算机解读影像的方式。与依靠手工设计规则不同，深度神经网络直接从大量带标签的样本中学习。在医学影像领域，一类称为卷积神经网络的模型尤为成功，因为它能够自动发现从简单边缘到复杂解剖形态的模式。在这类方法中，“You Only Look Once”（YOLO）家族因能够极快且一次性地识别图像中的目标而突出。最新一代 YOLOv12 融入了注意力机制和多尺度处理，这些特性对寻找像头影测量标志点这样的小且密集的结构尤为有利。

构建更聪明的标志点检测器

作者将两个公开可用的侧位颅骨 X 光图像集合合并，总计略少于 500 张图像，每张图像均由经验丰富的临床医生标注了 19 个重要的头影测量标志点。他们将图像转换为更紧凑的格式，并将每个标志点坐标转换为以该点为中心的小方框，以便设计用于检测方框对象的 YOLOv12 能将每个标志点视为微小目标。借助名为 Roboflow 的平台，他们去除了重复图像并应用了适度的变换，例如轻度旋转、亮度变化和噪声。这些变换有效地将训练图像数量扩增了约三倍，帮助模型在图像质量和患者解剖差异方面变得更加鲁棒。

AI 的训练与测试细节

研究人员在一块强大的图形处理器上对大型 YOLOv12 模型进行了 50 个训练轮（epoch）。在训练过程中，模型的内部层学会将原始 X 光片转换为一组突出重要区域的特征，输出“头部”则学会在每个标志点周围绘制小方框并为其分配置信度分数。训练完成后，模型在 94 张此前未见过的 X 光片上进行了测试。为评估性能，团队测量了每个预测标志点与专家标注点之间的距离，还分析了精度-召回曲线、不同标志点间的混淆模式，以及显示特定点一致性的详细图示。

AI 做对了什么——以及它在哪些方面挣扎

总体而言，该系统约有一半的标志点在与专家标注相距 1 毫米范围内被找到，略超过 80% 在 2 毫米范围内——这一范围对许多临床任务被视为可接受。模型在具有清晰形状与高对比度的标志点上表现优异，例如蝶鞍（Sella）、颏点（Gnathion）、颏尖（Menton）以及某些与牙齿相关的点，超过四分之三的预测在 1 毫米内，超过 93% 在 2 毫米内。模型在区分下巴和前牙附近的紧密簇状点上也出乎意料地表现良好，表明它学到了细微的空间关系，而不仅仅是孤立的像素。不过，它在一些模糊区域表现欠佳，如下颌角（Gonion）、上前突点（Subspinale）、眶下缘（Orbitale）、关节点（Articulare）和耳孔（Porion）。这些区域即使对人类也更难判断，因为骨骼重叠和低对比度使边界不清，再加上低质量 X 光会进一步降低准确性。

这对未来正畸护理意味着什么

作者得出的结论是，他们基于 YOLOv12 的系统尚不足以取代人类专家，但它作为半自动头影测量分析的概念验证已相当有力。在实践中，此类工具可以快速放置初步标志点，供临床医生随后微调，从而将 AI 的速度与一致性与专业判断相结合。随着规模更大、更多样化的训练数据集、对低质量图像更好的处理方法以及模型的持续改进，未来版本可能接近真正的临床级性能。如果达到这一点，正畸医生可能很快会减少手工描记 X 光片的时间，而将更多精力用于利用这些测量制定个性化治疗方案。

引用: Akre, P.D., Ghavghave, Y.G. & Pacharaney, U. A YOLOv12-based approach for automatic detection of cephalometric landmarks on 2D lateral skull X-ray images. Sci Rep 16, 12837 (2026). https://doi.org/10.1038/s41598-026-43250-z

关键词: 头影测量分析, 正畸影像学, 深度学习, 标志点检测, YOLOv12