Clear Sky Science · ru
Система промышленной безопасности в реальном времени на основе архитектур YOLO с использованием различных цветовых представлений
Более бдительный взгляд на заводском цехе
Скрытые изъяны в металлических швах могут превратить прочные машины, мосты или трубопроводы в тихие угрозы. Традиционно обученные инспекторы внимательно просматривают светящиеся швы металла, пытаясь заметить крошечные трещины или щели до того, как они приведут к авариям. В этой работе исследуется, как искусственный интеллект может взять на себя значительную часть такой наблюдательной работы, используя быстрое программное обеспечение для распознавания изображений для анализа сварных швов в реальном времени, даже когда детали проходят мимо на конвейере. Сравнивая несколько версий популярного детектора AI под названием YOLO и тестируя, как разные способы представления цвета влияют на его «зрение», авторы показывают путь к более безопасным и эффективным производствам.

Почему так сложно заметить плохие швы
На загруженной производственной линии сварные швы различаются по форме, блеску и фону. На одном изображении может быть несколько швов и дефектов, что делает простую классификацию изображения («хорошо» или «плохо» в целом) слишком грубой. Вместо этого система должна одновременно находить и помечать конкретные проблемные участки вдоль шва. Авторы фокусируются на трёх практических категориях — хороший шов, плохой шов и явный дефект — поскольку для каждой требуется разная реакция: от приёмки детали до немедленного доработки. Они используют общедоступный набор данных из более чем шести тысяч аннотированных изображений швов, что обеспечивает обучение и тестирование ИИ на реалистичном наборе поверхностей, условий освещения и типов дефектов.
Учим машины смотреть один раз и решать
Исследование сосредоточено на семействах моделей обнаружения объектов YOLO («You Only Look Once»), известных тем, что сканируют изображение за один проход и обводят найденные объекты рамками. Исследователи сравнивают три поколения: YOLOv3, YOLOv5 и новейший YOLOv8. Каждая версия повышает скорость и точность за счёт более глубоких сетей и более умных стратегий обучения. Чтобы лучше имитировать сложные условия освещения на реальных производствах, команда также преобразует каждое изображение сварного шва в четыре различных цветовых пространства — RGB (традиционные красный–зелёный–синий), HSV, LAB и YCbCr — и обучает отдельные модели на каждом из них. Такой мультиспектральный подход позволяет задать конкретный вопрос: помогает ли изменение кодировки цвета ИИ яснее видеть дефекты?
Цвет, скорость и точность в действии
Во всех экспериментах прослеживается одна закономерность: новейшая модель YOLOv8 превосходит предшественников. Обученная на стандартных RGB-изображениях, YOLOv8 достигает нормализованного среднего значения точности (mAP@0.5) 0.592, что заметно выше, чем у YOLOv3 и YOLOv5 при тех же условиях. В практическом плане это означает, что она лучше как находит, так и правильно маркирует области сварки. Модель также чрезвычайно быстрая: примерно 138 изображений в секунду на современной графической карте — значительно выше эталонных 30 кадров в секунду, часто используемых для реального времени. Среди цветовых пространств RGB последовательно даёт лучшие результаты для всех трёх версий YOLO, тогда как HSV, LAB и YCbCr отстают. Эти альтернативные кодировки могут подчёркивать определённые визуальные особенности, но в данном случае их преимущества не перевешивают простоту и информативность RGB.
От лабораторных испытаний до периферии производства
Чтобы продемонстрировать практическую реализуемость, авторы разворачивают облегчённую модель YOLOv8 на периферийном устройстве на базе Raspberry Pi, подключённом к конвейеру и камере. По мере того как свариваемые детали проходят под объективом, система захватывает кадры, предварительно обрабатывает их базовыми методами и выполняет обнаружение локально, классифицируя каждый шов как хороший, плохой или дефектный. Результаты заносятся в базу данных и отображаются на панели инспекторов, которые могут видеть маркеры дефектов в реальном времени и долгосрочные тенденции качества. Кроме того, фреймворк может генерировать рекомендации — например, предлагать корректировки скорости сварки или напряжения, либо сигнализировать о необходимости обслуживания оборудования при повторяющихся дефектах.

Что это означает для более безопасного производства
Для непрофессионала ключевой вывод прост: работа показывает, что лёгкая современная модель ИИ может надёжно и очень быстро отмечать рискованные швы в реальных промышленных условиях, особенно при использовании обычных RGB-камер. YOLOv8 оказывается достаточно точной, чтобы уверенно отличать явно дефектные швы, и достаточно быстрой, чтобы не отставать от скоростных производственных линий, при этом работая на скромном аппаратном обеспечении рядом с оборудованием. Авторы утверждают, что такой автоматизированный, учитывающий цвет осмотр может снизить человеческие ошибки, выявлять проблемы раньше и поддерживать более безопасное и стабильное производство. Дальнейшие улучшения — например, более богатые обучающие данные и лучшее обращение с более тонкими типами дефектов — могут сделать этих цифровых инспекторов повседневной частью промышленной безопасности.
Цитирование: Pati, N., Sharma, A., Gourisaria, M.K. et al. A real-time industrial safety automation using YOLO architectures leveraging diverse chromatic domains. Sci Rep 16, 7253 (2026). https://doi.org/10.1038/s41598-026-37869-1
Ключевые слова: обнаружение дефектов сварки, автоматизация промышленной безопасности, YOLOv8, компьютерное зрение в реальном времени, edge AI