Clear Sky Science · zh

DEENet：一种用于钢材表面缺陷检测的边缘增强型 CNN–Transformer 双编码器模型

2026-01-30 · 返回目录

为什么钢材上的微小缺陷很重要

从汽车和桥梁到家用电器，现代生活在很多方面都依赖钢材。然而，这些产品的可靠性可能会被肉眼难以察觉、即便在显微镜下也不易发现的微小缺陷削弱。本文提出了 DEENet，一种新的计算机视觉系统，能够比现有工具更准确、更高效地自动检测钢带表面的细微缺陷，帮助工厂及早发现问题、提高安全性并减少浪费。

识别小缺陷的挑战

钢材表面在生产过程中会产生多种缺陷：鱼鳞状斑块、凹坑、发丝状裂纹、夹杂物和划痕等。传统检查依赖人工或简单的图像滤波器，这些方法速度慢、不一致，且容易被嘈杂的工厂背景干扰。现代的“一次检测”算法（如 YOLO 系列）能在一遍扫描中处理图像，但仍会漏检极小或低对比度的缺陷，并且常常模糊损伤区域的边界。当健康区域与受损区域之间的边界模糊时，检测器会错误估计大小和位置，导致漏检或误报。

融合两种视觉方式

DEENet 通过结合两种互补的图像观察方式来解决这一问题。一条分支是经典的卷积神经网络（CNN），善于捕捉细小的局部纹理，比如微小的凹坑或细裂缝。另一条分支是基于 Transformer 的网络，它将图像分块，擅长捕捉更广泛的上下文——即模式在整个钢带上的相互关系。在 DEENet 中，这两条分支像一双“并列的眼睛”：一只关注细节，另一只关注整体画面。一个定制的双通道融合（Dual Channel Fusion）模块随后将它们的输出混合，使图像的每个区域既由其局部纹理描述，又由其在整体场景中的角色来刻画。这种交互使系统在检测那些密集且微小的缺陷时，比旧模型更为敏感。

锐化损伤轮廓

即便特征信息很丰富，检测器在绘制清晰的缺陷边界时仍可能遇到困难，尤其是当缺陷逐渐与背景融合时。为此，作者设计了一个专注于边缘增强的模块，称为 C2f_EEM，专门关注受损与未受损区域之间强度变化的边界。该模块通过若干不同尺寸的滤波器处理特征，以捕捉从细小裂缝到较大斑块的结构，然后采用一种对比式处理来强调显著的变化。这个过程突出了边缘所在的“高频”内容，使裂缝和凹坑更为突出，同时以轻量计算实现，适合在生产线上实时运行。

对系统进行测试

研究人员在一个广泛使用的钢带缺陷基准上评估了 DEENet，该基准包括六种常见缺陷类型，每种类型都有数百张样本图像。与标准的基于 YOLO 的检测器及新型 Transformer 风格模型相比，DEENet 在平均精度均值（mean Average Precision，一种衡量检测既正确又定位准确的综合指标）上表现更高，达到了 81.4%。在最难的类别——类似细裂网状且对比度极低的“网裂（crazing）”——上，提升尤其显著。DEENet 不仅找到了更多这些棘手的缺陷，而且框选更紧致，同时保持整体计算量足够低，便于实际部署。在另一个工业数据集以及加入噪声和光照变化的图像上的额外测试表明，该模型即使在恶劣条件下仍保持高精度。

对日常产品意味着什么

简单来说，这项研究表明，让机器视觉系统对同一钢材表面形成两种互补的“视角”并教会它锐化边缘，可以使缺陷检测更智能、更可靠。DEENet 在发现微小、模糊缺陷并精确描绘其轮廓方面的改进，可能帮助钢厂更早发现问题、减少废料，并为从摩天大楼到智能手机的各种产品提供更一致的材料。作者同时指出，仍需进一步工作来缩减模型以适配低功耗设备，并在更多不同类型的工厂中进行测试，但他们的成果标志着重工业质量控制向更安全、更高效、更自动化迈进的一步。

引用: Pan, W., Zhong, R., Huang, J. et al. DEENet: an edge-enhanced CNN–Transformer dual-encoder model for steel surface defect detection. Sci Rep 16, 6692 (2026). https://doi.org/10.1038/s41598-026-36390-9

关键词: 钢材缺陷, 计算机视觉, 深度学习, 质量检测, 工业自动化