Clear Sky Science · ru

Лёгкая сегментационная система YOLO11n для обнаружения трещин на поверхности в реальном времени

· Назад к списку

Почему важны мелкие трещины

Скрытые трещины в дорогах, мостах и зданиях могут казаться безобидными, но часто именно они являются первыми признаками износа конструкции. Раннее обнаружение этих линий помогает предотвратить дорогостоящие ремонты или даже катастрофические отказы. Тем не менее большинство проверок по-прежнему выполняют люди, проходя или проезжая вдоль поверхностей и записывая заметки вручную. В этом исследовании рассматривается, как компактная система искусственного интеллекта может в режиме реального времени обнаруживать и очерчивать трещины достаточно быстро, чтобы работать на дронах, небольших роботах и низкопотребляющих датчиках, а не только в мощных центрах обработки данных.

От ручных проверок к машинному зрению

Инженеры давно пытались автоматизировать обнаружение трещин с помощью традиционных методов обработки изображений, таких как детекция границ и пороговая обработка. Эти методы работают в чистых лабораторных условиях, но быстро теряют точность в реальном мире, где тени, пятна и грубая текстура вводят простые алгоритмы в заблуждение. В последнее время глубокое обучение изменило ситуацию: нейронные сети могут научиться распознавать, как выглядят трещины, непосредственно по изображениям. Ранние версии могли лишь сказать, содержит ли небольшой фрагмент изображения трещину, но им было трудно точно указать её положение, да и они часто были слишком медленными для проверки в реальном времени.

Как компактная модель учится видеть трещины

Авторы опираются на семейство моделей YOLO — популярный набор инструментов в области компьютерного зрения, известный возможностью обнаруживать объекты за один быстрый проход по сети. В центре внимания — очень маленькая версия под названием YOLO11n-seg, адаптированная для трассировки точной формы трещин, а не только для обводки их приблизительными прямоугольниками. Модель обучают на датасете Crack-Seg, который содержит более 11 000 тщательно размеченных дорожных изображений, где каждое пиксельное значение трещины отмечено. Изображения приводят к стандартному размеру и подают в сеть, которая постепенно учится отличать тонкие извилистые узоры реального повреждения от безвредных фоновых деталей, таких как текстура или грязь.

Figure 1
Figure 1.

Умные приёмы для мелких деталей

Чтобы заметить волосоподобные трещины на шершавом бетоне, модель использует две архитектурные хитрости. Во‑первых, специальный блок под названием C3k2 автоматически переключается между малыми и слегка большими окнами обзора, что позволяет отслеживать как очень тонкие, так и более протяжённые трещины. Во‑вторых, модуль пространственного внимания C2PSA обучает модель фокусироваться на вероятных областях с трещинами, игнорируя отвлекающие элементы, такие как масляные пятна, тени или узорчатые поверхности. Вместе эти дополнения помогают системе аккуратнее очерчивать трещины и уменьшают вероятность принятия фоновых дефектов за структурные повреждения, при этом сохраняя модель достаточно компактной для работы на скромном оборудовании.

Быстрые результаты без тяжёлого железа

В экспериментах лёгкая сеть содержит всего около 2,8 миллиона параметров — ничтожно мало по сравнению со многими современными системами глубокого обучения — но при этом показывает уровень производительности, сопоставимый с более крупными и медленными решениями. На бенчмарке Crack-Seg она правильно определяет области трещин с точностью примерно 79% и демонстрирует высокие показатели соответствия предсказанных контуров трещин эталонным разметкам. Ключевой момент: обработка одного изображения занимает примерно 3,6 миллисекунды на стандартной GPU, что соответствует сотням кадров в секунду. По сравнению с широко используемыми моделями, такими как U-Net, Mask R-CNN и более ранним вариантом YOLO, она обеспечивает конкурентную или лучшую точность сегментации при значительно большей скорости, что делает её практичной для непрерывных видеопотоков с дронов или инспекционных транспортных средств.

Figure 2
Figure 2.

К автоматическим проверкам конструкций

Для неспециалистов главный вывод заключается в том, что теперь возможно создать небольшие, эффективные инструменты ИИ, которые не только находят трещины, но и быстро прослеживают их точную форму и размер в режиме реального времени. Хотя чрезвычайно тонкие трещины при плохом освещении или неблагоприятной погоде остаются сложной задачей, предложенная система YOLO11n-seg предлагает разумный баланс скорости и надёжности. С дальнейшими улучшениями и интеграцией в полевое оборудование такие модели могут помочь городам и ведомствам обнаруживать повреждения раньше, расставлять приоритеты в ремонтах и поддерживать критическую инфраструктуру в более безопасном состоянии с меньшими трудозатратами.

Цитирование: Tiwari, S., Gola, K.K., Kanauzia, R. et al. A lightweight YOLO11n seg framework for real time surface crack detection with segmentation. Sci Rep 16, 6566 (2026). https://doi.org/10.1038/s41598-026-37073-1

Ключевые слова: трещины в инфраструктуре, компьютерное зрение, глубокое обучение, инспекция в реальном времени, сегментация YOLO