Clear Sky Science · ru
DEENet: усовершенствованная на краях двойная энкодерная модель CNN–Transformer для обнаружения дефектов на стальной поверхности
Почему мелкие изъяны в стали важны
От автомобилей и мостов до бытовой техники — современная жизнь во многом опирается на сталь. Тем не менее надёжность всех этих изделий может быть подорвана дефектами настолько малыми, что их трудно заметить даже под микроскопом. В этом исследовании представлена DEENet — новая система компьютерного зрения, которая автоматически обнаруживает тонкие дефекты на полосах стали более точно и эффективно, чем существующие средства, помогая заводам выявлять проблемы на ранней стадии, повышать безопасность и снижать потери.

Задача обнаружения мелких дефектов
На стальных поверхностях в процессе производства появляются разные виды дефектов: чешуйчатые участки, ямки, тонкие трещины, включения посторонних материалов и царапины. Традиционный осмотр полагается на людей или простые фильтры изображений, что медленно, непоследовательно и легко ошибается на шумном фоне заводской среды. Современные «one-shot» алгоритмы, такие как семейство YOLO, умеют просматривать изображение за один проход, но всё ещё пропускают очень мелкие или низкоконтрастные дефекты и часто размывают границы повреждённых участков. Когда граница между здоровой и повреждённой сталью расплывчата, детекторы ошибочно оценивают размер и положение, что приводит к пропускам дефектов или ложным срабатываниям.
Сочетание двух способов «взгляда»
DEENet решает эту проблему, объединяя два дополняющих друг друга способа анализа изображения. Одна ветвь — классическая сверточная нейронная сеть (CNN) — хорошо улавливает тонкие локальные текстуры, такие как мелкие ямки или тонкие царапины. Вторая ветвь — сеть на базе Transformer — разрезает изображение на патчи и превосходно улавливает более широкий контекст — как соотносятся шаблоны по всей полосе стали. В DEENet эти две ветви работают как «близнецы-глаза»: одна сосредоточена на деталях, другая — на общей картине. Пользовательский модуль Dual Channel Fusion затем смешивает их выходы так, чтобы каждый участок изображения описывался и локальной текстурой, и его ролью в общей сцене. Такое «перекрёстное общение» делает систему более чувствительной к мелким, скученным дефектам, которые старые модели склонны пропускать.
Уточнение контура повреждений
Даже при богатых признаках детекторы могут испытывать трудности с проведением чётких границ вокруг дефектов, особенно когда они плавно сливаются с фоном. Чтобы решить эту задачу, авторы разработали модуль усиления краёв C2f_EEM, который специально фокусируется на изменениях интенсивности на границах между повреждёнными и неповреждёнными областями. Он прогоняет признаки через несколько фильтров разного размера, чтобы захватить структуры от тонких трещин до более широких пятен, затем использует своего рода сравнение «до и после», чтобы подчеркнуть резкие переходы. Этот процесс выделяет высокочастотное содержимое, где «живут» края, делая трещины и ямки более заметными, при этом оставаясь лёгким по вычислительным затратам и подходящим для использования в реальном времени на производственных линиях.

Проверка системы на практике
Исследователи оценили DEENet на широко используемом бенчмарке дефектов стальной полосы, содержащем шесть распространённых типов изъянов, каждый из которых представлен сотнями изображений. По сравнению со стандартными детекторами на базе YOLO и современными моделями в стиле Transformer, DEENet достигает более высокого mean Average Precision — сводной метрики того, насколько часто обнаружения одновременно корректны и точно расположены — достигая 81,4%. Наибольшие улучшения наблюдаются в самой сложной категории «crazing» (мелкая сеть трещин), которая имеет очень низкий контраст. DEENet не только находит больше таких трудных дефектов, но и обводит их более плотными рамками, сохраняя при этом общие вычислительные затраты на уровне, приемлемом для практического развёртывания. Дополнительные испытания на другом промышленном наборе данных и на изображениях с добавленным шумом и изменениями освещения показывают, что модель остаётся точной даже при ухудшении условий.
Чем это полезно для повседневных изделий
Проще говоря, исследование показывает, что обеспечение системы машинного зрения двумя дополняющими «взглядами» на ту же стальную поверхность — и обучение её усилению краёв — может сделать обнаружение дефектов более умным и надёжным. Повышенная способность DEENet замечать мелкие, слабовыраженные изъяны и точно их очерчивать может помочь сталелитейщикам обнаруживать проблемы раньше, сокращать брак и поставлять более однородные материалы для всего, от небоскрёбов до смартфонов. Авторы отмечают, что требуется дальнейшая работа по уменьшению размера модели для энергонезависимых устройств и по тестированию в более разнообразных условиях заводов, но их результаты являются шагом к более безопасному, эффективному и автоматизированному контролю качества в тяжёлой промышленности.
Цитирование: Pan, W., Zhong, R., Huang, J. et al. DEENet: an edge-enhanced CNN–Transformer dual-encoder model for steel surface defect detection. Sci Rep 16, 6692 (2026). https://doi.org/10.1038/s41598-026-36390-9
Ключевые слова: дефекты стали, компьютерное зрение, глубокое обучение, контроль качества, промышленная автоматизация