Clear Sky Science · ru
Многоуровневая сеть внимания с диффузионным усилением для обнаружения дефектов стальной поверхности в производстве поликристаллического кремния
Почему крошечные дефекты стали вдруг имеют большое значение
За каждой блестящей солнечной панелью стоит целый лес стальных башен, где очищают поликремний — ультрачистый материал, лежащий в основе современной фотоэлектрики. Если в этих башнях появляются микроскопические трещины или ямки, металл может незаметно ослабеть до катастрофического отказа производства или, что хуже, до угрозы безопасности рабочих. В этой статье представлена новая система искусственного интеллекта, способная быстро и надёжно обнаруживать такие дефекты, даже когда они почти незаметны невооружённым глазом, что открывает путь к более безопасному и эффективному производству солнечных материалов.
Солнечные фабрики и их скрытые слабые места
Башни для дистилляции поликремния работают в экстремальных условиях: при температурах около 1 000–1 200 °C, в агрессивных парах, при ослепляющих отражениях и на сложном визуальном фоне. На их стальных поверхностях могут появляться разные типы дефектов — микротрещины, крошечные ямки, отложения кремния, царапины, дефекты сварки и пятна примесей. Каждый из них отличается по размеру, форме и текстуре, и многие слиты с фоном. Традиционные методы инспекции во многом зависят от человеческих экспертов или стандартных инструментов компьютерного зрения, которые испытывают трудности при выделении слабых, нерегулярных дефектов в зашумлённых сценах в реальном времени. По мере роста масштабов производства фотоэлементов это становится серьёзным узким местом для контроля качества и безопасности заводов.

Более «внимательный» взгляд на сложные дефекты
Исследователи предложили MSEOD-DDFusionNet — специализированную систему глубокого обучения, разработанную специально для суровых промышленных условий. Вместо одной монолитной сети они построили конвейер из четырёх взаимосотрудничающих модулей, каждый из которых решает ключевую проблему существующих детекторов. Во-первых, этап объединения признаков сохраняет мелкие детали на нескольких масштабах, чтобы крошечные дефекты не терялись при сжатии изображений внутри сети. Далее динамическая свёртка позволяет системе перенастраивать свои фильтры на лету, помогая ей соответствовать причудливым контурам реальных трещин, ямок и отложений. Третий модуль разделяет задачи подавления шума и усиления слабых сигналов, благодаря чему хрупкие паттерны дефектов усиливаются, а не стираются. Наконец, диффузионный этап обучает систему выживать в условиях реалистичных шумов — бликов, размытия и тепловых артефактов — учась очищать повреждённые признаки, не размывая сами дефекты.
От снимков с дрона к надёжным решениям
Для проверки своего подхода команда создала новый промышленный датасет DDTE, состоящий из 6 252 высокоразрешённых изображений, снятых дроном в нескольких метрах от работающего оборудования. Эксперты разметили шесть критических типов дефектов точными ограничивающими прямоугольниками и перепроверяли друг друга для достижения высокого согласия. Новую систему затем сравнили с популярными моделями обнаружения объектов, такими как семейство YOLO и несколько методов на базе трансформеров, не только на DDTE, но и на публичных наборах по дефектам стали и даже на несвязаных доменах, таких как бытовые фотографии (PASCAL VOC) и микроскопия кровяных клеток (BCCD). Во всех испытаниях MSEOD-DDFusionNet последовательно находила больше дефектов, локализовала их точнее и работала быстрее сильнейших базовых моделей, при этом имея меньше параметров, чем многие конкуренты.

Что говорят цифры о производительности
На основном датасете DDTE новая система достигла 82,6% средней точности по стандартному порогу обнаружения (mAP50) и 61,6% по более строгим порогам, превзойдя сильную базовую модель YOLO и работая почти на 200 кадров в секунду. Она показала особенно заметный прирост в сложных категориях, таких как ямки и дефекты сварки, где сложные формы и освещение часто сбивают с толку другие методы. На дополнительных наборах по дефектам стали система существенно улучшила распознавание нерегулярных повреждений, таких как трещины и включения. Даже при переносе на повседневные сцены и медицинские изображения та же архитектура сохраняла высокую точность и скорость, что указывает на то, что принципы проектирования — лучшее сохранение многоуровневых деталей, адаптация к форме и устойчивое моделирование шума — полезны не только на заводах по производству поликремния.
Что это означает для промышленности и не только
Для неспециалиста итог прост: авторы создали более внимательный, более адаптивный и более устойчивый «взгляд» для машин. Тщательно прорабатывая, как их сеть сохраняет мелкие детали, отслеживает причудливые формы и учится игнорировать вводящий в заблуждение шум, они достигают почти передовых показателей точности, при этом сохраняя систему достаточно лёгкой для развёртывания в реальном времени на цеховых площадках. На практике это означает, что стальные башни на предприятиях по производству солнечных материалов можно инспектировать быстрее и надёжнее, снижая риск неожиданных отказов и повышая качество продукции. Те же идеи могут применяться и в других критичных для безопасности областях — от трубопроводов и мостов до медицинских сканов — где разница между безопасной и опасной системой может скрываться в дефекте размером всего в несколько пикселей.
Цитирование: Duan, Y., He, L., Wang, Z. et al. Multiscale diffusion-enhanced attention network for steel surface defect detection in Polysilicon Production. Sci Rep 16, 5307 (2026). https://doi.org/10.1038/s41598-026-35913-8
Ключевые слова: дефекты поверхности стали, производство поликремния, инспекция промышленного оборудования, обнаружение с помощью глубокого обучения, компьютерное зрение