Clear Sky Science · ru
MFDH‑Net: сеть обнаружения дефектов для многоуровневого объединения признаков и головы с декуплингом кросс‑восприятия
Почему мелкие повреждения важны на современных заводах
От тончайших стальных листов до плотно собранных печатных плат и глянцевых кузовных панелей автомобилей — сегодняшние фабрики зависят от поверхностей, близких к совершенству. Даже волосовидная трещина или крошечная точка коррозии способны сократить срок службы изделия, вызвать отзыв продукции или остановить конвейер. Годы работники вручную всматривались в быстро движущиеся детали, пытаясь заметить такие дефекты. В этой статье описывается MFDH‑Net — новая система искусственного интеллекта, которая автоматически находит трудно различимые дефекты на промышленных поверхностях, стремясь сделать инспекцию быстрее, надежнее и проще масштабируемой.
Проблема обнаружения тонких дефектов
Промышленные дефекты обманчивы. Царапины, ямки и пятна могут напоминать обычную текстуру или изменения освещения; некоторые дефекты крошечны, другие занимают большие участки; многие проявляются на насыщенном, шумном фоне. Традиционные системы компьютерного зрения испытывают трудности, когда разные типы дефектов выглядят очень похоже, когда повреждения малы и бледны или когда объекты на изображении имеют множество размеров. Авторы сосредоточились на поверхностях, таких как стальные листы, печатные платы и кузовные детали автомобилей, где эти проблемы особенно выражены. Их цель — разработать детектор, который умеет отделять «нормальные» шаблоны от по‑настоящему аномальных, даже когда различия тонкие и распределены по широкому диапазону масштабов.

Смотреть близко и далеко одновременно
MFDH‑Net начинается с новой основы, названной Сетью извлечения признаков в двойной доменной постановке (Dual‑domain Feature Extraction Network). Она построена так, чтобы рассматривать каждое изображение двумя взаимодополняющими способами. Одна ветвь, вдохновленная классическими сверточными нейросетями, фокусируется на мелких локальных деталях — тонких краях и текстурах. Другая ветвь, вдохновленная моделями Transformer, улавливает дальние взаимосвязи по всему изображению, помогая системе понимать более широкий контекст вокруг подозрительного дефекта. Эти два взгляда не отделены друг от друга: сеть многократно позволяет локальным и глобальным признакам взаимодействовать, так что маленькая царапина оценивается не только по ближайшим пикселям, но и по тому, как она контрастирует с общим рисунком поверхности.
Переплетение информации по масштабам и позициям
После извлечения признаков модель должна согласовать информацию от малых, средних и крупных структур. Авторы предлагают Многоуровневую сеть агрегации признаков (Multilevel Feature Aggregation Network), которая передает сигналы вверх и вниз между слоями, а не в одном направлении. Такая архитектура поощряет глубокое взаимодействие между тонкими деталями и шаблонами более высокого уровня, с адаптивными весами, которые подсказывают модели, насколько доверять каждому масштабу. Еще один компонент, Модуль пространственно‑семантического слияния (Spatial Semantic Fusion Module), выравнивает признаки с разных разрешений так, чтобы область, обозначающая царапину в одном слое, точно совпадала с той же областью в другом. Это тщательное выравнивание помогает избежать путаницы, когда один слой помечает участок как дефект, а другой — как фон.

Специализированные головы для «что» и «где»
Идентификация дефекта включает два переплетенных вопроса: какого рода повреждение и где именно оно расположено? MFDH‑Net решает это с помощью Головки декуплинга с кросс‑восприятием (Cross‑aware Decoupling Head), разделяющей обработку на ветви, настроенные на классификацию («что») и точную локализацию («где»). Механизм внимания с кросс‑восприятием дополнительно выделяет маленькие или бледные дефекты, перенастраивая веса пространственных областей и каналов признаков, которые вероятнее всего содержат поврежления, при этом ослабляя влияние фонового шума. Это особенно важно для крошечных дефектов на платах или панелях автомобилей, которые иначе могли бы затеряться среди сложных текстур и отражений.
Насколько хорошо работает система?
Исследователи протестировали MFDH‑Net на нескольких требовательных публичных и реальных наборах данных: стальных поверхностях, печатных платах, наборе многотипных стальных дефектов и кузовных деталях автомобилей, собранных с производственной линии. По всем этим задачам сеть показала очень высокую точность обнаружения, часто превышающую 94% при корректном определении и локализации дефектов, при этом работая в реальном времени на скорости около 52 кадров в секунду. Тщательные абляционные исследования — где отдельные компоненты поочередно удаляются — показывают, что каждая часть конструкции, от двойного доменного извлечения признаков до многоуровневого слияния и специализированной детектирующей головы, приносит измеримые улучшения. В сравнении с рядом популярных детекторов, включая как классические сверточные модели, так и более новые гибридные и Transformer‑основанные системы, MFDH‑Net стабильно демонстрировала лучшее соотношение точности и скорости.
Что это означает для умного производства
Для неспециалистов основной вывод таков: MFDH‑Net предлагает более надежный автоматизированный способ обнаружения крошечных дефектов, которые человеческий инспектор может пропустить, не замедляя производство. Сочетая анализ крупным планом с панорамным обзором поверхности и аккуратно связывая информацию по масштабам и задачам, система способна с высокой уверенностью отмечать дефекты на различных продуктах. Хотя подход по‑прежнему зависит от размеченных обучающих данных, которые могут быть затратными в получении, он указывает путь к будущим системам инспекции, быстро адаптирующимся к новым фабрикам и продуктам. Вкратце, работа приближает отрасль к проверкам качества поверхности, столь же строгим, как глаз эксперта, но более быстрым, последовательным и простым в развертывании в масштабе.
Цитирование: Zhang, L., Yang, Z., Ma, Y. et al. MFDH-Net: defect detection network for multi-level feature fusion and cross-sensing decoupling head. Sci Rep 16, 9750 (2026). https://doi.org/10.1038/s41598-026-40568-6
Ключевые слова: обнаружение промышленных дефектов, компьютерное зрение, глубокое обучение, контроль качества, интеллектуальное производство