Clear Sky Science · ru

Объяснимая гибридная CAD-система ИИ для продвинутого прогнозирования дефектов поверхности стали

· Назад к списку

Почему даже крошечные повреждения на стали должны вас волновать

От автомобилей и кораблей до небоскрёбов и роботов — многие повседневные вещи строятся из плоских стальных листов. Если мелкие трещины, ямки или царапины проходят незамеченными на заводе, они могут ослабить конструкции, сократить срок службы изделий и увеличить расходы. В этой статье описана новая система искусственного интеллекта, которая действует как супервнимательный инспектор: она точнее обнаруживает и объясняет едва заметные дефекты на стальной поверхности по сравнению с современными инструментами и при этом остаётся достаточно быстрой для использования в реальных производственных линиях.

Figure 1
Figure 1.

Как сегодня проверяют сталь — и почему этого недостаточно

Традиционная инспекция стали опирается на людей или простые правила обработки изображений. Люди быстро устают и могут пропустить слабые или неправильной формы дефекты. Системы, основанные на правилах, теряют эффективность при малейших изменениях освещения, материала или формы дефекта, а такое часто встречается на реальных производствах. В последние годы модели глубокого обучения, особенно семейство детекторов YOLO, начали применять для автоматического поиска дефектов. Но такие одноэтапные системы пытаются одновременно решать две разные задачи: точно обводить дефекты рамками и определять их тип. Когда дефекты малы, имеют странную форму или сливаются с фоновым металлом, такой объединённый подход часто либо пропускает дефекты, либо путает их категории.

Разделение задач на две части для более острого зрения

Авторы предлагают «гибридную» CAD-архитектуру, которая сознательно разделяет поиск дефектов и их классификацию. Сначала улучшенный детектор под названием Fusion YOLO сосредотачивается только на простом вопросе «есть ли здесь дефект?» для каждой области. Он объединяет три оптимизированные модели на базе YOLO, включая собственную конструкцию DCBS-YOLO, и сливает их предложения с помощью техники усреднения перекрывающихся рамок вместо их удаления. Это позволяет системе строить более надёжные контуры вокруг подозрительных областей, особенно когда дефекты малы, необычной формы или слабо различимы на фоне.

Обучение системы видеть и детали, и общую картину

После того как локальные области с вероятными дефектами найдены, на втором этапе решается, какого они типа — например, трещинообразная «крейзинг»-полоса, ямка, пласт или царапина. Здесь фреймворк использует сочетание нескольких свёрточных нейронных сетей (CNN), хороших в улавливании тонкой текстуры, и Vision Transformer, который превосходен в обнаружении крупных паттернов и долгих связей по изображению. Их карты признаков объединяются так, чтобы локальные детали и глобальный контекст учитывались совместно. Такая схема существенно снижает путаницу между типами дефектов, которые кажутся похожими как человеку, так и машине. Среди различных семейств CNN лучшая тройка вместе с Transformer, обученные сквозным способом, показали почти идеальные результаты классификации на эталонных наборах данных.

Очистка изображения и автоматическая настройка моделей

Чтобы дать ИИ наилучшие условия для работы, авторы разработали предварительную обработку изображений стали, которая мягко усиливает их. Регулируя яркость и контраст, уменьшая шум и подчёркивая грани — при этом аккуратно сохраняя общую корректность изображения — система делает слабые дефекты более заметными без создания искусственных артефактов. Кроме того, рабочий процесс на базе MLOps автоматически исследует множество настроек обучения, таких как скорость обучения и размер батча, чтобы найти наиболее эффективные комбинации для детекции и классификации. Эта автоматизация сокращает переборы методом проб и ошибок и обеспечивает, что финальные модели близки к своему оптимальному поведению на задаче.

Figure 2
Figure 2.

Открывая «чёрный ящик» с помощью визуальных объяснений

Поскольку промышленные пользователи должны доверять системе прежде, чем поставить её на линию, архитектура включает инструменты объяснимого ИИ. После того как дефект помечен, метод Grad-CAM строит тепловую карту, которая подчёркивает те части изображения, которые сильнее всего повлияли на решение. Эти цветовые наложения показывают инспекторам, куда именно «смотрел» ИИ, когда называл дефект трещиной или ямкой. В случаях, когда первый этап детекции пропускает дефект, стадия классификации и её тепловые карты всё ещё могут выявить подозрительные области, действуя как резервная сеть и помогая инженерам понять оставшиеся «слепые» зоны.

Что означают эти результаты для реальных заводов

Протестированная на двух широко используемых наборах данных дефектов стали новая система превзошла как стандартные модели YOLO, так и несколько недавних исследовательских решений, показывая высокую точность обнаружения и классификации при хорошей обобщающей способности на новые типы дефектов. Хотя двухэтапная архитектура требует больше вычислительных ресурсов и пока чуть не дотягивает до идеальной скорости в реальном времени, она уже приближается к частотам кадров, необходимым на многих производственных линиях. Авторы утверждают, что при дальнейшей инженерной доработке такой подход может стать практическим помощником по инспекции: помощником, который замечает более тонкие дефекты, объясняет свои выводы и помогает производителям выпускать более безопасные и надёжные изделия на основе стали.

Цитирование: Moon, C., Al-antari, M.A. & Gu, Y.H. Explainable hybrid AI CAD framework for advanced prediction of steel surface defects. Sci Rep 16, 10796 (2026). https://doi.org/10.1038/s41598-025-34320-9

Ключевые слова: инспекция поверхности стали, обнаружение дефектов, глубокое обучение, компьютерное зрение, объяснимая ИИ