Clear Sky Science · zh

Diamond-DETR:用于合成钻石的轻量级实时质量评估算法

· 返回目录

为什么人造钻石上的微小瑕疵很重要

合成钻石是现代工业中经常被忽视的主力,负责切削、打磨和抛光从金属零件到电子产品的各种材料。但它们的性能和价格取决于微小的表面缺陷——缺口、裂纹和不规则形状——这些在显微镜下也难以被人迅速识别。本文提出了 Diamond-DETR,一种紧凑的人工智能系统,旨在对合成钻石进行实时自动检验,以加速质量检查、提高可靠性,并便于在普通工厂硬件上部署。

Figure 1
Figure 1.

从人眼到自动化视觉

几十年来,工厂依赖机械分选方法和借助显微镜的人工专家来判断钻石质量。像振动筛或基于密度的分离这类机械方法在颗粒非常小或非常纯净时效果欠佳,也无法区分完美晶体与带有缺口的晶体。人工检测虽然灵活,但速度慢、容易疲劳且带有主观性。随着对高精度、大批量合成钻石分选的需求增长,制造商需要能在颗粒紧密堆积或尺寸、形状各异时,仍能快速且一致地发现微小缺陷的自动化视觉系统。

把局部细节与整体视野结合

现代计算机视觉工具大致分为两类。轻量级卷积神经网络擅长捕捉局部细节——例如角的锋利度——但在理解整张图像的全局上下文时可能吃力。相比之下,基于变压器的模型善于把握全局场景和长程关系,但通常计算量大且较慢,尤其不利于实时检测。Diamond-DETR 建立在近来提出的变压器检测器 RT-DETR 之上,并针对工业钻石检测进行了改造。目标是在保留变压器强大全局推理能力的同时,削减计算量并强化网络对钻石表面细微小尺度几何缺陷的识别能力。

更精简的检测引擎

作者对检测流程的三大部分进行了重新设计。首先,他们将标准主干网络替换为定制的“RepFasterNet”模块,该模块只对部分图像通道使用更昂贵的空间运算,然后高效合并这些信息。这一步在保留缺陷常见的边缘和角落等关键细节的同时减少了计算量。第二,他们引入了高层筛选特征融合金字塔,利用注意力机制让强的高层信号指导在不同放大级别上强调或抑制哪些低层细节。第三,他们用膨胀卷积升级了跨阶段融合模块,有效扩大了每个神经元的“感受野”,而不使网络更深。这些改动共同帮助模型在复杂背景和多种尺寸下识别钻石及其缺陷,同时还能在中端硬件上保持高速运行。

Figure 2
Figure 2.

将系统付诸测试

为评估 Diamond-DETR,团队构建了自有的合成钻石颗粒显微图像数据集,根据可见表面特征将每个实例标注为高质量或有缺陷。他们将新模型与原始 RT-DETR 及若干知名检测器进行了比较,包括流行的 YOLO 系列和经典的两阶段系统如 Faster R-CNN。在这个内部钻石数据集上,Diamond-DETR 在精确度、整体检测得分和处理速度方面均有所提升,同时使用的参数比 RT-DETR 更少。通过热图的可视化解释显示,新模型比基线更紧密地关注有意义的几何区域——尤其是边缘和角落。在对另一份金属螺母的工业数据集的补充测试中,Diamond-DETR 保持了强劲的表现,表明其设计可推广到其他由复杂形状定义的制造零件。

对工厂及更广领域的意义

从实际角度看,Diamond-DETR 为显微级钻石分选线提供了一种更紧凑、更准确且更快速的“自动检测器”。模型体积仅数十兆字节且具备实时处理速度,非常适合无法承载超大规模 AI 系统的资源受限环境。该方法并非完整的质量解决方案——它无法检测内部裂纹或分析化学成分——但它提供了一个强有力的视觉前端,可与其他传感工具配合使用。通过表明基于变压器的检测器可以被精简并调优以实现精细几何辨别,这项工作为类似模型在自动化检测小型工业零件(从磨料到紧固件)中的更广泛应用指明了方向,因为这些零件的微小表面缺陷会带来重大的经济影响。

引用: Yan, X., Yang, S., Zhang, S. et al. Diamond-DETR: lightweight real-time quality evaluation algorithm for synthetic diamonds. Sci Rep 16, 10711 (2026). https://doi.org/10.1038/s41598-026-44951-1

关键词: 合成钻石, 自动化检验, 目标检测, 工业视觉, 变压器模型