Clear Sky Science · zh
MFDH-Net:用于多层特征融合与跨感知解耦头的缺陷检测网络
为什么微小瑕疵在现代工厂很重要
从刀片般薄的钢板到密集的电路板以及光亮的车身面板,当今的工厂依赖几乎完美的表面。即便是一道细微裂纹或针尖大小的腐蚀点,也能缩短产品寿命、引发召回或使生产线停摆。多年来,工人们不得不盯着快速移动的零件试图用肉眼发现这些缺陷。本文介绍了 MFDH‑Net,一种新的人工智能系统,旨在自动发现工业表面上难以察觉的缺陷,使检验更快、更可靠、更易于规模化。
发现微妙缺陷的挑战
工业缺陷具有迷惑性。划痕、凹坑和污渍可能与普通纹理或光照变化相似;有些瑕疵很小,有些则覆盖大范围;许多缺陷出现在复杂、嘈杂的背景上。传统的计算机视觉系统在不同类型的缺陷外观相似、缺陷细小且微弱,或图像中对象尺寸多样时往往表现不佳。作者关注的表面包括钢板、印刷电路板和汽车车身零件,这些场景中上述问题尤为严重。他们的目标是设计一个检测器,能够将“正常”模式与真正的异常区分开来,即便差异很微妙并横跨大范围尺度。

同时兼顾近景与远景
MFDH‑Net 以一种名为双域特征提取网络的新骨干网为起点。该骨干旨在以两种互补的方式观察图像。一条分支受经典卷积神经网络启发,聚焦于细小的局部细节,如微小边缘和纹理;另一条分支受 Transformer 模型启发,捕捉跨整个图像的远程关系,帮助系统理解怀疑缺陷周围的整体语境。这两种视角并非彼此独立:网络反复让局部与全局特征交互,从而使得对一条微小划痕的判断,不仅基于其直接像素,还基于它与整体表面模式的对比。
在尺度与位置间编织信息
在提取特征之后,模型必须在小尺度、中尺度和大尺度结构之间协调信息。作者引入了多层特征聚合网络,它在层间以上下双向传递信息而非单向流动。这一设计鼓励细粒度细节与高层模式之间的深度交互,并通过自适应权重告诉模型应信任哪些尺度。另一个组件——空间语义融合模块——将不同分辨率的特征对齐,使得在一层中表示为划痕的区域能与另一层中的相同区域精确对应。这种精细的对齐有助于避免混淆,例如一层将某区域判为缺陷而另一层将其判为背景的情况。

针对“是什么”和“在哪里”的专用头
识别缺陷涉及两个交织的问题:这是什么类型的瑕疵?它精确位于何处?MFDH‑Net 通过一种跨感知解耦头来解决这一点,该模块将处理分为适用于分类(“是什么”)和精确定位(“在哪里”)的分支。一个跨感知注意力机制进一步通过对可能包含缺陷的空间区域和特征通道重新加权,来强调微小或微弱的缺陷,同时抑制背景杂波。这对电路板或车身面板上细小的缺陷尤为重要,否则这些缺陷可能在复杂纹理和反光中被淹没。
系统表现如何?
研究人员在若干具有挑战性的公开和真实世界数据集上测试了 MFDH‑Net:钢材表面、印刷电路板、多类型钢材缺陷集以及从生产线采集的汽车车身零件。在这些测试中,网络在检测和定位缺陷方面取得了很高的准确率,常常超过 94%,同时仍能以约 52 帧每秒的实时速度运行。细致的消融研究——即逐一移除各个组件的试验——表明从双域特征提取到多层融合再到专用检测头的每一部分设计都带来了可测的提升。与包括经典卷积模型以及新型混合与基于 Transformer 的系统在内的一系列流行检测器相比,MFDH‑Net 始终在准确性与速度之间提供了更好的平衡。
这对智能制造意味着什么
对非专业读者来说,主要结论是 MFDH‑Net 提供了一种更可靠的自动化手段,能发现人工检验可能遗漏的微小缺陷,而不会拖慢生产速度。通过将近景细节分析与宽角全局视野结合,并在尺度与任务间精心编织信息,该系统可以高置信度地标注多种产品上的瑕疵。尽管该方法仍依赖标注训练数据,获取这些数据可能成本不菲,但它指向了未来能快速适应新工厂和新产品的检验系统。简言之,这项工作使工业表面质量检测更接近于人类专家之眼的严格程度,但速度更快、结果更一致且更易于大规模部署。
引用: Zhang, L., Yang, Z., Ma, Y. et al. MFDH-Net: defect detection network for multi-level feature fusion and cross-sensing decoupling head. Sci Rep 16, 9750 (2026). https://doi.org/10.1038/s41598-026-40568-6
关键词: 工业缺陷检测, 计算机视觉, 深度学习, 质量检验, 智能制造