Clear Sky Science · zh

一种轻量级 YOLO11n 分割框架,用于实时表面裂缝检测与分割

· 返回目录

为何细小裂缝至关重要

道路、桥梁和建筑中隐蔽的裂缝看上去可能无害,但它们常常是结构退化的早期警示信号。及早发现这些裂缝可以避免昂贵的维修,甚至防止灾难性故障。然而,大多数巡检仍由人工步行或缓慢驾驶并手工记录完成。该研究探讨了一种紧凑的人工智能系统,如何在实时中检测并勾画出裂缝,速度足以在无人机、小型机器人和低功耗传感器上运行,而不仅限于强大的数据中心。

从人工检查到机器视觉

工程师长期以来尝试用传统图像处理方法(如边缘检测和阈值分割)来自动化裂缝检测。这些方法在干净的实验室环境中有效,但在真实世界中很快失效——阴影、污渍和粗糙纹理会使简单算法迷惑。近来,深度学习改变了游戏规则:神经网络可以直接从图像中学习裂缝的特征。早期方法能判断小图像块中是否存在裂缝,但难以精确标出裂缝位置,且常常速度不够快,无法满足实时巡检需求。

瘦身模型如何学会识别裂缝

作者基于 YOLO 系列模型构建,YOLO 是计算机视觉中以一次快速前向传递识别物体著称的一类工具。他们聚焦于一种非常小的版本,称为 YOLO11n-seg,专门用于描绘裂缝的精确形状,而不仅仅是用粗略的框圈出来。模型在 Crack-Seg 数据集上训练,该数据集包含超过 11,000 张精心标注的路面图像,每个裂缝像素都有标记。图像被调整为标准格式并输入网络,网络逐步学会将真实损伤的细长、弯曲模式与诸如纹理或污垢等无害背景细节区分开来。

Figure 1
Figure 1.

针对微小细节的巧妙设计

为在粗糙混凝土上识别发丝状裂缝,模型采用了两项设计技巧。首先,一个称为 C3k2 的特殊模块会在小视野和略大视野之间自动切换,使其既能跟踪非常细的裂缝,也能覆盖更长的裂缝。其次,一个名为 C2PSA 的空间注意力模块教会模型关注可能存在裂缝的区域,同时忽略油渍、阴影或有规则图案的表面等干扰。这些改进协同作用,使系统能更干净地勾勒裂缝,并降低将背景瑕疵误判为结构性损伤的概率,同时保持模型足够小,能在性能有限的硬件上运行。

无需重型硬件也能快速运行

在测试中,该轻量网络仅包含约 280 万参数——与许多现代深度学习系统相比极为精简——但其性能可与更大、更慢的设计相匹配。在 Crack-Seg 基准上,它对裂缝区域的识别精度约为 79%,并在预测裂缝形状与真实标注的匹配度上取得了较高评分。关键是,在标准 GPU 上它每张图像大约处理 3.6 毫秒,折合为每秒数百帧。与常用模型如 U-Net、Mask R-CNN 以及早期的 YOLO 变种相比,它在分割精度上具有竞争力或更好,同时速度大幅领先,使其适用于来自无人机或检测车辆的连续视频流。

Figure 2
Figure 2.

迈向自动化结构体检

对非专业读者而言,主要结论是:这项工作表明现在可以构建体积小、效率高的人工智能工具,不仅能发现裂缝,还能快速勾勒其精确形状和尺寸,适用于实时监测。尽管在光线极差或恶劣天气条件下,极细微裂缝仍然具有挑战性,但所提出的 YOLO11n-seg 系统在速度与可靠性之间提供了令人鼓舞的平衡。随着进一步改进并集成到现场设备中,这类模型可帮助城市和相关机构更早发现损伤、优先安排维修,并以更少的人工投入提高关键基础设施的安全性。

引用: Tiwari, S., Gola, K.K., Kanauzia, R. et al. A lightweight YOLO11n seg framework for real time surface crack detection with segmentation. Sci Rep 16, 6566 (2026). https://doi.org/10.1038/s41598-026-37073-1

关键词: 基础设施裂缝, 计算机视觉, 深度学习, 实时检测, YOLO 分割