Clear Sky Science · ru

Эффективный метод обнаружения объектов на основе вейвлет-преобразования и прогрессивной пирамиды признаков: кейс инспекции энергетических сетей

2026-02-04 · Назад к списку

Сохраняя линии электропередачи свободными от скрытых опасностей

Электричество обеспечивает работу современной жизни, но линии электропередачи, по которым оно передаётся, более уязвимы, чем кажется. Повседневные предметы — шарики, змеи, полиэтиленовые пакеты или птичьи гнёзда — могут зацепиться за провода высокого напряжения, создавая риск искрения, отключений и дорогостоящего ремонта. Энергокомпании всё чаще используют дроны и камеры для патрулирования протяжённых участков, однако обнаружить крошечные, с низкой контрастностью объекты на насыщенных деталями изображениях по-прежнему сложно и для человека, и для стандартных систем ИИ. В этом исследовании представлен более быстрый и точный метод компьютерного зрения, который помогает ремонтным бригадам автоматически выявлять такие опасности в реальном времени.

Почему маленькие объекты трудно заметить

Изображения коридоров линий электропередачи визуально сложны. Большую часть сцены занимают широкие ровные области — небо, поля или реки, тогда как критичные с точки зрения безопасности элементы — провода, изоляторы и посторонние предметы — представляют собой тонкие линии или маленькие пятна. Стандартные системы детекции, такие как семейство YOLO, разработаны для повседневных фото с более крупными и явными объектами, например людьми или автомобилями. В аэрофотосъёмке линий электропередачи шарики или мусор могут занимать всего несколько пикселей и часто сливаться с опорами или проводами. В результате часто возникают промахи, ложные срабатывания на фоновые структуры и нестабильная работа в более загруженных сценах.

Обучение ИИ «читать» изображение по частотам

Авторы решают эту проблему, изменив способ «взгляда» нейронной сети на изображение. Вместо того чтобы опираться только на обычную сетку пикселей, они добавляют сверточный слой на основе вейвлетов — WTConv. Вейвлеты разлагают изображение на низкочастотные составляющие, которые фиксируют гладкие фоновые области, и высокочастотные — которые подчёркивают границы и тонкие детали. В предлагаемой конструкции сеть отдельно обрабатывает эти компоненты, а затем вновь объединяет их без потери информации. Это позволяет одновременно сохранять широкий контекст коридора и усиливать такие структуры, как провода, опоры и мелкие посторонние предметы — без увеличения сложности или замедления модели.

Накладывая признаки, чтобы видеть на разных масштабах

Обнаружение птичьего гнезда на арке опоры или змея, застрявшего на нескольких проводах, требует понимания взаимосвязи паттернов на разных масштабах изображения. Для этого в исследовании предложена Прогрессивная Пирамида Признаков (PFPN). Она берёт признаки из поверхностных и глубоких слоёв сети и сливает их в два прохода: сначала от грубого к тонкому, затем обратно от тонкого к грубому. Шаг «адаптивного слияния» обучается определять для каждой локации, каким масштабам следует больше доверять. Такое прогрессивное наложение даёт карты признаков, которые лучше соответствуют реальным посторонним объектам, и уменьшает путаницу, когда мелкие опасности перекрываются с крупными металлическими структурами.

Тонкая настройка того, как рисуются рамки

Даже когда модель правильно находит объект, ей нужно точно обвести его рамкой. Обычные функции обучения ориентированы на степень перекрытия предсказанной и истинной рамки, но это может вводить в заблуждение для крошечных, слабо заметных целей. Исследователи уточняют этот шаг с помощью нового Loss-функции «Inner-EIoU», которая уделяет особое внимание тому, насколько хорошо совпадают центральные области рамок. Поощряя плотное выравнивание в ядре, метод помогает модели точнее определять истинное положение маленьких или частично скрытых посторонних предметов, делая итоговые детекции более надёжными.

Доказательство эффективности в реальных условиях

Для проверки своей разработки команда собрала специализированный набор данных из 4700 изображений реальных коридоров высокого напряжения, охватывающих сцены от городов до сельской местности, и разметила четыре распространённых типа опасностей: мусор, шарики, птичьи гнёзда и змеи. По сравнению со стандартной базовой моделью YOLOv11 улучшенная модель обнаруживает больше таких объектов при меньшем числе ошибок, повышая как точность, так и общие показатели детекции. При этом она использует примерно на одну пятую меньше параметров и работает примерно на 18% быстрее, что делает её подходящей для дронов или периферийных устройств, работающих в реальном времени. Тесты на широком общедоступном бенчмарке (MS COCO) показывают схожие улучшения, что указывает на переносимость идей за пределы линий электропередачи. На практике это означает, что коммунальные службы могут внедрять более умные и лёгкие системы инспекции, которые надежнее обнаруживают мелкие опасности до того, как они приведут к серьёзным проблемам.

Цитирование: Ye, J., Yuqi, B., Wendi, W. et al. Efficient target detection method based on wavelet transform and progressive feature pyramid network: a case study of power grid inspection. Sci Rep 16, 7318 (2026). https://doi.org/10.1038/s41598-026-37017-9

Ключевые слова: инспекция линий электропередачи, обнаружение посторонних предметов, съемка с дронов, компьютерное зрение в реальном времени, лэинии высокого напряжения