Clear Sky Science · zh
具有渐进扩张的多尺度融合卷积网络用于钢带表面缺陷的实时显著目标检测
为什么钢材上的细小瑕疵很重要
从车身到桥梁,长长的钢带每天在生产线下卷出。即便是微小的凹坑或划痕,也可能削弱最终产品或导致昂贵的返工。在工业速度下逐厘米人工检查是不可能的,因此工厂依赖计算机视觉。本研究提出了一种新的图像分析方法,能够快速且可靠地发现钢带表面的缺陷,从而跟上真实生产线的节奏。

识别突出的区域
作者关注的任务称为显著目标检测,即让计算机突出图像中视觉上最显眼的区域。在钢带上,这些区域通常是斑点、斑块或划痕等缺陷。基于深度学习的既有方法已优于人工设计的图像滤波器,但许多方法对实时应用而言过于缓慢或庞大。其他方法在缺陷尺度变化或光照条件不同的情况下表现欠佳,而这在繁忙的工厂环境中很常见。
兼顾细节与整体视野
为了解决这些问题,研究团队设计了一种名为 MSFNet-PD 的新网络。其核心思想是将输入图像分解为若干特征层,每层捕捉不同层次的细节。一个关键点是多尺度融合:模型同时观察精细的局部纹理和更广的形状,然后将这些信息融合。这有助于它区分微弱的划痕与正常纹理,并识别不符合常见钢材模式的异常斑块。设计上不依赖沉重的注意力模块,而是采用流线型的连接以保持计算轻量。
以渐进视野逐步扩展
第二个思路是渐进扩张。简单来说,模型先在小的像素邻域内进行观察,随着特征在网络中深入,逐步扩大其视野。这种逐步增加“感受野”的方式使系统能在不模糊重要边缘的情况下感知小型和大型缺陷。通过合理安排这些扩张卷积,网络能同时捕捉长而细的划痕、微小夹杂物和大面积污渍,同时保持损伤与未损伤区域之间清晰的边界。

足够快以适应生产线
团队在包含三类主要缺陷的公开钢带图像数据集上测试了 MSFNet-PD。他们将其与各种现有模型进行了比较,范围从高精度但庞大的系统到为速度优化的超轻量模型。该方法达到了良好的平衡:在运行速度远超大多数模型的同时,性能可与许多高精度方法匹敌或相近,在现代图形处理器上每秒可处理数千张图像。细致的实验表明,结合多种扩张尺度并在多尺度上融合特征对于实现这种速度与精度的平衡至关重要。
对工业的意义
对非专业读者而言,结论是这项研究为钢材检测线提供了更智能的“相机大脑”。MSFNet-PD 能够实时扫描移动的金属带,清晰描出可能的缺陷轮廓,并且只需适度的计算资源。尽管作者指出还需在其他材料和工厂环境中进行更多测试,但他们的结果表明,这类轻量级、多尺度的设计可以帮助制造商更早、更可靠地发现瑕疵,从而提高安全性并减少浪费,而不会拖慢生产速度。
引用: Zhang, Z., Zou, Y., Liu, X. et al. Multi-scale fusion convolution network with progressive dilation for real-time salient object detection of surface defects on strip steel. Sci Rep 16, 15387 (2026). https://doi.org/10.1038/s41598-026-43386-y
关键词: 钢带缺陷, 显著目标检测, 实时检测, 深度学习, 工业视觉