Clear Sky Science · zh

对比学习增强的 MobileMamba：用于边缘设备实时工业缺陷检测

2026-01-13 · 返回目录

为工厂金属配备更聪明的“眼睛”

从汽车和飞机到桥梁与家用电器，现代生活依赖于不能开裂、剥落或腐蚀的金属部件。如今，许多工厂仍然依靠笨重的计算机甚至人工检验员来在高速生产线上发现微小缺陷。本文介绍了一种新型紧凑人工智能（AI）系统，能够在运行于直接安装在制造设备旁的低功耗设备时，快速且准确地检测金属表面上的极小缺陷。

为什么微小裂纹是大问题

金属板材和型材在成为成品之前会经过焊接、铸造和切割等工序。在此过程中可能产生裂纹、孔洞、划痕及其他表面缺陷。被漏检的缺陷会缩短零件寿命，甚至导致危险的失效。基于深度学习的计算机视觉系统已经开始自动化这类检测工作，但许多最精确的方法过于缓慢或体积过大，无法在工厂偏好在线安装的小型廉价“边缘”设备上运行。现有的快速模型又常在非常小或低对比度缺陷上表现不佳，容易被噪声或有纹理的背景误导。

更轻、更锐利的数字检验员

作者提出了 MobileMamba，一种专为工业金属检测设计的轻量级检测网络。它基于流行的 YOLO 系列目标检测模型，但用更高效且更善于整幅图像感知的组件替换了架构中的关键部分。核心思想是采用一种近期的序列建模技术称为 Mamba，它能以比基于注意力的网络少得多的计算量捕捉图像中的长程模式。通过使用深度可分卷积封装成纤巧的模块，MobileMamba 学会将如发丝般的细微裂纹等局部细节与跨越整张金属板的更广泛上下文结合，同时保持模型体积和功耗较低。

教模型关注真正重要的东西

真实的检验图像中以正常、无缺陷的区域占多数，因此模型很容易倾向于把大多数内容判为“合格”。为应对这一点，研究者在训练中加入了基于对比学习的辅助目标。训练时，系统不断比较缺陷区域（前景）与干净背景区域的特征模式，同时也对正确的缺陷框与错误预测进行对比。关键是它并不把所有背景样本一视同仁：系统会自动找到那些最像缺陷的“困难”负样本——外观最易混淆的背景补丁——并强制模型对它们给予额外关注。该额外损失项仅在学习阶段使用，模型部署运行时不会带来额外开销，从而不影响实时使用。

在真实工厂数据上验证性能

团队在三个广泛使用的钢铁和铝材表面工业数据集上测试了他们的方法，这些数据集包含裂纹、内含物和轧制凹坑等多种缺陷类型。与若干现代轻量检测器相比，新方法在使用更少参数和更低计算量的同时，持续取得更高的检测评分。在所有三个数据集上，它比具有类似紧凑规模的基于 YOLO 的模型提升了约三个百分点的准确率。随后，作者构建了更小的 MobileMamba “纳米”版本并将其部署在廉价的 NVIDIA Jetson Nano 边缘板上。即使在降低图像分辨率的情况下，该版本仍实现了至少 25 帧每秒的实时检验速度，并在准确率上优于其他面向边缘的检测器。

对真实工厂的意义

对非专业人士来说，主要结论很直接：这项工作交付了一个既足够快速又节省资源以运行在小型工业计算机上的 AI 检验工具，并且足够灵敏以捕捉金属表面上细小、难以发现的缺陷。通过重新设计网络收集整图信息的方式并训练其关注最具迷惑性的背景“相似物”，作者表明工厂无需在速度与可靠性之间做出妥协。通过进一步改进，例如更聪明的压缩方法或将普通图像与热成像或 X 光视图结合，像 MobileMamba 的方法有望帮助为各类生产线带来更安全、更一致的质量控制。

引用: Huang, J., Ariffin, S.A., Yang, Q. et al. Contrastive learning enhanced MobileMamba for real time industrial defect detection on edge devices. Sci Rep 16, 5096 (2026). https://doi.org/10.1038/s41598-026-35515-4

关键词: 金属缺陷检测, 边缘人工智能, 工业检测, 轻量神经网络, 对比学习