Clear Sky Science · ru
Контрастивное обучение улучшает MobileMamba для обнаружения дефектов в реальном времени на пограничных устройствах
Более зоркие глаза для фабричного металла
От автомобилей и самолётов до мостов и бытовой техники — современная жизнь зависит от металлических деталей, которые не должны трескаться, шелушиться или покрываться ямками. Сегодня многие заводы по‑прежнему полагаются на громоздкие компьютеры или даже на ручных инспекторов, чтобы обнаруживать крошечные дефекты на быстро движущихся линиях. В этой статье представлен новый компактный искусственный интеллект, способный быстро и точно заметить очень мелкие повреждения на металлической поверхности, даже когда он работает на энергоэффективных устройствах, установленных непосредственно у оборудования, производящего эти детали.
Почему маленькие трещины — большая проблема
Металлические листы и профили проходят через этапы сварки, литья и резки, прежде чем стать готовыми изделиями. По пути они могут получить трещины, отверстия, царапины и другие поверхностные дефекты. Пропущенные повреждения могут сократить срок службы детали или даже привести к опасным отказам. Системы компьютерного зрения на основе глубинного обучения начали автоматизировать эту проверку, но многие из наиболее точных методов слишком медленные или тяжёлые, чтобы работать на небольших, недорогих «edge»‑устройствах, которые заводы предпочитают устанавливать на линии. Существующие быстрые модели, в свою очередь, часто испытывают трудности при работе с очень мелкими или слабо контрастными дефектами и могут быть обмануты шумным или узорчатым фоном.

Лёгкий и острый цифровой инспектор
Авторы представляют MobileMamba — новую лёгкую сеть обнаружения, разработанную специально для промышленного контроля металла. Она опирается на популярную семью моделей обнаружения объектов YOLO, но заменяет ключевые части архитектуры компонентами, которые одновременно более эффективны и лучше видят общую картину. Центральная идея — использовать недавнюю технику моделирования последовательностей под названием Mamba, которая способна улавливать дальнодействующие закономерности в изображении при значительно меньших вычислениях, чем сети на основе механизма внимания. Окутанная в тонкий строительный блок с глубинными свёртками, MobileMamba учится сочетать тонкие локальные детали, такие как едва заметная трещина, с более широкой контекстной информацией по всему листу металла, при этом сохраняя небольшой размер модели и низкие энергопотребление.
Обучение модели тому, что действительно имеет значение
Реальные инспекционные изображения в основном состоят из нормальных, бездефектных областей, поэтому модель легко может сместиться в сторону маркировки всего как «OK». Чтобы противостоять этому, исследователи добавляют вспомогательную цель обучения на основе контрастивного обучения. Во время обучения система постоянно сравнивает паттерны признаков из областей с дефектами (передний план) с теми, что взяты из чистых фоновых областей, а также сопоставляет правильные ограничивающие рамки дефектов с некорректными предсказаниями. Важно, что она не рассматривает все фоновые примеры одинаково: автоматически выделяются «трудные» негативы — фоновые фрагменты, наиболее похожие на дефекты, — и модель принуждается уделять им дополнительное внимание. Этот дополнительный член функции потерь используется только в процессе обучения и исчезает при работе, поэтому он не замедляет работу в реальном времени.

Доказательства эффективности на реальных производственных данных
Команда протестировала подход на трёх широко используемых промышленных наборах данных по поверхностям стали и алюминия, содержащих различные типы дефектов, такие как трещины, включения и прокатные ямки. По сравнению с несколькими современными лёгковесными детекторами новый метод последовательно демонстрировал более высокие показатели обнаружения при меньшем числе параметров и вычислений. На всех трёх наборах данных он повысил точность примерно на три процентных пункта по сравнению с аналогично компактными моделями на базе YOLO. Авторы затем создали ещё более мелкую «нано»‑версию MobileMamba и развернули её на недорогой платформе NVIDIA Jetson Nano. Даже при уменьшенных размерах изображений эта версия обеспечивала скорость инспекции в реальном времени не менее 25 кадров в секунду и при этом превосходила другие ориентированные на edge‑устройства детекторы по точности.
Что это значит для реальных заводов
Для неспециалистов главный вывод прост: эта работа предоставляет AI‑инспектора, который одновременно достаточно быстрый и экономный для небольших промышленных компьютеров, но при этом достаточно точный, чтобы улавливать тонкие, трудноразличимые дефекты на металлических поверхностях. За счёт переработки способов сбора информации по изображению и обучения модели сосредотачиваться на самых коварных похожих на дефекты фоновых участках авторы показывают, что заводам не придётся выбирать между скоростью и надёжностью. С дальнейшими доработками, такими как более умное сжатие и объединение обычных изображений с тепловыми или рентгеновскими обзорами, подходы наподобие MobileMamba могут помочь обеспечить более безопасный и стабильный контроль качества на широком спектре производственных линий.
Цитирование: Huang, J., Ariffin, S.A., Yang, Q. et al. Contrastive learning enhanced MobileMamba for real time industrial defect detection on edge devices. Sci Rep 16, 5096 (2026). https://doi.org/10.1038/s41598-026-35515-4
Ключевые слова: обнаружение дефектов на металле, edge AI, промышленный контроль, легковесные нейронные сети, контрастивное обучение