Clear Sky Science · zh

基于多尺度卷积与注意力机制的航空铝材表面缺陷检测方法

2026-01-28 · 返回目录

金属上微小缺陷为何至关重要

从飞机机翼到智能手机外壳，铝制零件必须近乎完美。显微级的划痕、漆面气泡或金属表面的微小凹坑可能发展成威胁安全的裂纹，缩短产品寿命或导致代价高昂的召回。人工逐件目视检查既缓慢又易出错，即使许多自动化相机也仍会漏掉最微小的缺陷。本研究探索了一种新的人工智能方法，能够以工业级速度更可靠地发现铝材表面的极小缺陷。

光滑金属上的隐患

铝型材是用于机身、机翼、油箱以及其他许多结构的长条和面板。尽管看上去平滑，其表面可能包含多种问题：保护层泄露、电导不良区域、橘皮纹理、划痕、污点、漆泡、喷漆条痕、凹坑和角落泄漏等。这些缺陷在高分辨率图像中常常只有几像素宽，并可能与反光或背景噪声混合在一起。传统检测——无论是人工还是较旧的机器视觉系统——在复杂光照和背景下都难以将此类微小痕迹与无害纹理区分开来。

教相机“一次看清”，但要更细致

近年来，基于深度学习的目标检测系统——尤其是 YOLO（You Only Look Once）系列——在工厂中用于缺陷检测变得流行。YOLOv11 是近期的一个版本，在许多任务上已兼具速度与精度，但仍倾向于漏检铝材上的极小缺陷。作者以轻量级的 YOLOv11n 变体为基础，重构其内部模块，使其在不过度减慢速度的前提下更关注细节。他们的方法结合了三大要点：一种同时捕获多尺度模式的更智能方式、一种让网络聚焦于最有信息像素的注意力机制，以及一种更谨慎的放大小尺度特征的方法，以免在处理过程中丢失它们。

在多尺度上观察细节

第一个创新是重新设计的特征提取模块，称为 C3k2-DWR-DRB，用以替换 YOLOv11n 中的标准块。通俗地说，该模块允许网络以多种“放大倍率”同时查看同一图像区域——对显微划痕非常近、对漆泡稍微广一点、对污渍或色变则更广。它采用特殊的膨胀卷积和将多条滤波路径合并为单一路径的技术，使模型在不变得庞大或缓慢的情况下既能观察细微纹理又能捕捉较大形状。浅层关注发丝状划痕，而深层跟踪油渍等宽幅缺陷，从而在一个统一系统中同时提升对小缺陷和大缺陷的识别能力。

帮助模型把注意力放在关键处

接着，研究者在网络末端附近加入了名为 SimAM 的注意力模块。SimAM 并不引入大量新参数，而是通过测量特征图中每个小区域与其周围的差异来估计其重要性。那些突出的区域——如微弱的气泡或污点——会被放大，而均匀的背景区域则被抑制。这使得检测器对真实缺陷更敏感，并且不易被反光或无害纹理干扰，从而减少漏检和误报。

重建微小模式而不使其模糊

第三个关键要素是用 CARAFE 上采样算子替代许多神经网络中常用的“拉伸”方法。标准技术如最近邻或双线性插值可能会模糊掉对小缺陷最关键的细节。CARAFE 学习如何基于局部上下文重组特征，有效决定每个新像素应如何由其邻域构成。这种感知内容的重建产生更清晰、更具信息量的小目标特征图，使气泡、凹坑和斑点更容易被检测器锁定。

将方法付诸测试

为评估系统，作者使用了来自一次在线竞赛的公开工业铝材表面图像数据集，并对所有缺陷标注进行了仔细复核。他们还通过小角度旋转、翻转和缩放扩充了数据集，以便模型在多样条件下看到缺陷。在该基准上，改进后的 YOLOv11n 模型在常用阈值下达到 79.4% 的平均精度（mAP），召回率为 76.6%，表明它在保持模型紧凑的同时，比原始 YOLOv11n 找到更多真实缺陷。对难以检测的小目标和“极小”目标（如漆泡和污点）表现出特别明显的提升，并在强劲显卡上仍保持约 178 帧/秒的实时速度。

对日常技术的意义

对非专业读者而言，结论是作者构建了一个更聪明、更轻量的“工厂之眼”：一个可以实时注意到铝表面几乎肉眼难见缺陷的相机与算法系统。通过巧妙结合多尺度分析、注意力机制与谨慎的上采样，他们的方法在不需要巨量计算资源的情况下同时提升了准确性与可靠性。如果在更苛刻的真实世界条件下进一步验证并适配低功耗硬件，这一方法有望帮助提高飞机、车辆、电子产品及其他金属制品的安全性和可靠性，同时减少浪费和检测成本。

引用: Zhang, R., Cai, S., He, Z. et al. Aerospace aluminum surface defect detection method based on Multi-Scale Convolution and attention mechanism. Sci Rep 16, 6428 (2026). https://doi.org/10.1038/s41598-026-37293-5

关键词: 铝材表面缺陷, 工业检测, 深度学习检测, YOLO 目标检测, 航空材料