Clear Sky Science · ru

Метод обнаружения защитных касок под землей на основе модели YOLOv11-SRA

· Назад к списку

Почему интеллектуальные проверки касок важны под землей

Глубоко под землей, в шахтах и туннелях, рабочие полагаются на защитные каски как на последнюю линию защиты от обвалов, техники и низких сводов. Однако в тёмных, запылённых и тесных проходах руководителям — и даже привычным камерам — трудно определить, кто действительно защищён. В статье представлен новая система компьютерного зрения на базе улучшенной модели YOLOv11-SRA, которая в реальном времени автоматически обнаруживает каски и оголённые головы даже при слабом освещении, заблокированных ракурсах и когда люди находятся далеко от камеры.

Figure 1
Figure 1.

Опасности полагаться только на человеческие проверки

Традиционные инспекции касок в шахтах по-прежнему во многом зависят от обходов людей по туннелям в поисках нарушений или от турникетов и постов контроля, через которые проходят рабочие. Эти методы медленные, охватывают лишь несколько точек и могут упускать рискованное поведение, когда люди уходят глубже под землю. Каски с датчиками или встроэлектроникой дают некоторую автоматизацию, но они дороги, трудны в обслуживании в тяжёлых условиях и требуют модификации каждой каски. По мере расширения горных работ и увеличения смен эти старые подходы не всегда обеспечивают круглосуточное, всешахтное наблюдение, необходимое для предотвращения несчастных случаев.

Обучение камер видеть каски в тяжёлых условиях

Недавние достижения в глубоком обучении изменили способы интерпретации изображений компьютерами, особенно для обнаружения объектов, таких как автомобили или пешеходы. Семейство алгоритмов YOLO широко используется, потому что оно сканирует изображение и локализует объекты за один быстрый проход — идеально для видеопотока в реальном времени. Однако подземные сцены ставят эти системы в трудные условия. Каски могут выглядеть как крошечные цветные пятна на далёкой голове, быть частично скрытыми за трубами или оборудованием или сливаться с фоном при тусклом, неравномерном освещении. Авторы разработали YOLOv11-SRA специально для решения этих задач, чтобы камеры в шахтах могли надёжно отличать защищённых рабочих от незащищённых.

Трёхчастное улучшение популярного движка зрения

Новая модель сохраняет общую структуру YOLOv11 — ввод, backbone, neck и detection head — но дополняет её тремя специализированными модулями. Во‑первых, блок SAConv позволяет сети одновременно смотреть на изображение на нескольких «уровнях увеличения», чтобы улавливать как мелкие удалённые каски, так и крупные близкие без дополнительных затрат. Во‑вторых, блок RCM направляет модель фокусироваться на длинных прямоугольных областях, соответствующих типичной форме головы и плеч человека в туннеле, помогая отслеживать края каски даже когда оборудование или другие рабочие мешают. В‑третьих, блок ASFF объединяет информацию с разных масштабов изображения, позволяя системе выбирать пиксель за пикселем, какой уровень лучше описывает каждую часть сцены. Вместе эти улучшения уменьшают путаницу между касками и фоновым шумом и уточняют контуры мелких или частично скрытых касок.

Figure 2
Figure 2.

Испытание системы на практике

Чтобы оценить работоспособность идей, исследователи обучали и тестировали модель на CUMT-HelmeT — открытой коллекции подземных кадров наблюдения, размеченных как «каска» и «без каски», а также другими распространёнными объектами. Поскольку исходный набор данных относительно невелик, его увеличили в пять раз при помощи обрезки, поворотов и осветления изображений для имитации разных углов съёмки и условий освещения. На этой сложной выборке YOLOv11-SRA показала среднюю аппроксимацию точности (mAP) около 84% и полноту (recall) близко к 80%, явно опередив несколько известных детекторов, включая новые версии YOLO, RetinaNet, SSD и Faster R-CNN. Несмотря на возросшую точность, модель остаётся компактной и эффективной: она использует меньше параметров и вычислений, чем большинство конкурентов, и может анализировать почти 100 изображений в секунду на современной видеокарте — достаточно быстро для оповещений в реальном времени.

Проникновение сквозь тьму, пыль и блики

Визуальные примеры показывают, как система действует в ситуациях, которые регулярно ставят в тупик старые методы: каски, наполовину закрытые препятствиями, сцены, освещённые лишь слабыми лампами, рабочие на расстоянии и резкие отражения от блестящих поверхностей. В каждом случае YOLOv11-SRA даёт более уверенные и стабильные обнаружения по сравнению с конкурирующими моделями. Она реже пропускает маленькие или тусклые каски и лучше избегает ложных срабатываний, когда яркие пятна или трубы имитируют цвет каски. Абляционные исследования — где авторы поочерёдно отключают модули — показывают, что каждый компонент полезен, но наибольший эффект достигается при сочетании всех трёх, что подтверждает работоспособность дизайна как интегрированной системы, а не набора отдельных приёмов.

От исследовательского прототипа к более безопасным сменам

Проще говоря, эта работа даёт камерам в шахтах более острое и адаптивное «видение» базового защитного снаряжения. Более надёжно отмечая работников без касок даже в шумных, слабоосвещённых видеопотоках, система YOLOv11-SRA может помочь руководителям вмешиваться раньше и снизить риск травм головы. Поскольку модель относительно лёгкая, её можно развернуть на встраиваемых устройствах рядом с камерами, а не только в удалённых центрах обработки данных. Авторы отмечают, что более широкий тренировочный набор и дальнейшее упрощение могли бы сделать подход ещё более устойчивым, однако их результаты уже указывают на более умный и масштабируемый мониторинг безопасности в сложных условиях современного подземного горного дела.

Цитирование: Wang, L., Wan, X., Shi, X. et al. A method for detecting safety helmets underground based on the YOLOv11-SRA model. Sci Rep 16, 6194 (2026). https://doi.org/10.1038/s41598-026-37148-z

Ключевые слова: безопасность подземного горного дела, обнаружение касок, компьютерное зрение, мониторинг в реальном времени, глубокое обучение