Clear Sky Science · zh

一种轻量级 YOLO11n 分割框架，用于实时表面裂缝检测与分割

2026-01-29 · 返回目录

为何细小裂缝至关重要

道路、桥梁和建筑中隐蔽的裂缝看上去可能无害，但它们常常是结构退化的早期警示信号。及早发现这些裂缝可以避免昂贵的维修，甚至防止灾难性故障。然而，大多数巡检仍由人工步行或缓慢驾驶并手工记录完成。该研究探讨了一种紧凑的人工智能系统，如何在实时中检测并勾画出裂缝，速度足以在无人机、小型机器人和低功耗传感器上运行，而不仅限于强大的数据中心。

从人工检查到机器视觉

工程师长期以来尝试用传统图像处理方法（如边缘检测和阈值分割）来自动化裂缝检测。这些方法在干净的实验室环境中有效，但在真实世界中很快失效——阴影、污渍和粗糙纹理会使简单算法迷惑。近来，深度学习改变了游戏规则：神经网络可以直接从图像中学习裂缝的特征。早期方法能判断小图像块中是否存在裂缝，但难以精确标出裂缝位置，且常常速度不够快，无法满足实时巡检需求。

瘦身模型如何学会识别裂缝

作者基于 YOLO 系列模型构建，YOLO 是计算机视觉中以一次快速前向传递识别物体著称的一类工具。他们聚焦于一种非常小的版本，称为 YOLO11n-seg，专门用于描绘裂缝的精确形状，而不仅仅是用粗略的框圈出来。模型在 Crack-Seg 数据集上训练，该数据集包含超过 11,000 张精心标注的路面图像，每个裂缝像素都有标记。图像被调整为标准格式并输入网络，网络逐步学会将真实损伤的细长、弯曲模式与诸如纹理或污垢等无害背景细节区分开来。

针对微小细节的巧妙设计

为在粗糙混凝土上识别发丝状裂缝，模型采用了两项设计技巧。首先，一个称为 C3k2 的特殊模块会在小视野和略大视野之间自动切换，使其既能跟踪非常细的裂缝，也能覆盖更长的裂缝。其次，一个名为 C2PSA 的空间注意力模块教会模型关注可能存在裂缝的区域，同时忽略油渍、阴影或有规则图案的表面等干扰。这些改进协同作用，使系统能更干净地勾勒裂缝，并降低将背景瑕疵误判为结构性损伤的概率，同时保持模型足够小，能在性能有限的硬件上运行。

无需重型硬件也能快速运行

在测试中，该轻量网络仅包含约 280 万参数——与许多现代深度学习系统相比极为精简——但其性能可与更大、更慢的设计相匹配。在 Crack-Seg 基准上，它对裂缝区域的识别精度约为 79%，并在预测裂缝形状与真实标注的匹配度上取得了较高评分。关键是，在标准 GPU 上它每张图像大约处理 3.6 毫秒，折合为每秒数百帧。与常用模型如 U-Net、Mask R-CNN 以及早期的 YOLO 变种相比，它在分割精度上具有竞争力或更好，同时速度大幅领先，使其适用于来自无人机或检测车辆的连续视频流。

迈向自动化结构体检

对非专业读者而言，主要结论是：这项工作表明现在可以构建体积小、效率高的人工智能工具，不仅能发现裂缝，还能快速勾勒其精确形状和尺寸，适用于实时监测。尽管在光线极差或恶劣天气条件下，极细微裂缝仍然具有挑战性，但所提出的 YOLO11n-seg 系统在速度与可靠性之间提供了令人鼓舞的平衡。随着进一步改进并集成到现场设备中，这类模型可帮助城市和相关机构更早发现损伤、优先安排维修，并以更少的人工投入提高关键基础设施的安全性。

引用: Tiwari, S., Gola, K.K., Kanauzia, R. et al. A lightweight YOLO11n seg framework for real time surface crack detection with segmentation. Sci Rep 16, 6566 (2026). https://doi.org/10.1038/s41598-026-37073-1

关键词: 基础设施裂缝, 计算机视觉, 深度学习, 实时检测, YOLO 分割