Clear Sky Science · fr

Une méthode de détection des casques en milieu souterrain basée sur le modèle YOLOv11-SRA

· Retour à l’index

Pourquoi des contrôles de casque plus intelligents sont essentiels sous terre

En profondeur, dans les mines et les tunnels, les ouvriers comptent sur les casques de sécurité comme dernier rempart contre les chutes de roche, les machines et les plafonds bas. Pourtant, dans des galeries sombres, poussiéreuses et encombrées, il est difficile pour les responsables — et même pour des caméras classiques — de savoir qui est correctement protégé. Cet article présente un nouveau système de vision par ordinateur, fondé sur un modèle amélioré YOLOv11-SRA, capable de repérer automatiquement en temps réel les casques et les têtes nues, même lorsque l’éclairage est faible, les vues sont partiellement obstruées et les personnes sont éloignées de la caméra.

Figure 1
Figure 1.

Les risques de s’en remettre aux contrôles humains

Les inspections traditionnelles des casques en mine reposent encore largement sur des agents qui parcourent les galeries pour repérer les infractions, ou sur des portiques et postes de contrôle que les travailleurs doivent franchir. Ces méthodes sont lentes, ne couvrent que quelques points et peuvent rater des comportements à risque dès que les personnes s’enfoncent davantage sous terre. Les casques équipés de capteurs, de puces ou d’électronique intégrée apportent un certain niveau d’automatisation, mais ils sont coûteux, difficiles à entretenir dans des conditions difficiles et nécessitent de modifier chaque casque. À mesure que l’exploitation minière s’étend et que les horaires de travail s’allongent, ces approches peinent à assurer la vigilance 24 h/24 sur l’ensemble du site, indispensable pour prévenir les accidents.

Apprendre aux caméras à repérer les casques dans des conditions difficiles

Les progrès récents de l’apprentissage profond ont transformé la manière dont les ordinateurs interprètent les images, en particulier pour détecter des objets comme des véhicules ou des piétons. La famille d’algorithmes YOLO est largement utilisée car elle peut analyser une image et localiser des objets en une seule passe rapide — idéal pour la vidéo en direct. Cependant, les scènes souterraines poussent ces systèmes à leurs limites. Les casques peuvent n’apparaître que comme de petites taches colorées sur une tête lointaine, être partiellement cachés derrière des tuyaux ou des machines, ou se fondre dans l’arrière-plan sous un éclairage faible et inégal. Les auteurs ont conçu YOLOv11-SRA spécifiquement pour faire face à ces difficultés, afin que les caméras en mine distinguent de façon fiable les travailleurs protégés et non protégés.

Une mise à niveau en trois volets d’un moteur de vision populaire

Le nouveau modèle conserve la structure générale de YOLOv11 — entrée, backbone, neck et tête de détection — mais ajoute trois modules spécialisés. D’abord, le bloc SAConv permet au réseau d’examiner chaque image à plusieurs « niveaux de zoom » simultanément, afin de détecter à la fois les petits casques lointains et les casques proches plus grands sans coût supplémentaire. Ensuite, le bloc RCM oriente le modèle pour qu’il se concentre sur des régions longues et rectangulaires correspondant à la forme typique de la tête et des épaules dans un tunnel, l’aidant à suivre les contours du casque même lorsque des équipements ou d’autres travailleurs gênent la vue. Enfin, le bloc ASFF fusionne les informations issues de plusieurs échelles d’image, permettant au système de choisir, pixel par pixel, quel niveau décrit le mieux chaque partie de la scène. Ensemble, ces améliorations réduisent la confusion entre casques et éléments du décor et affinent le contour des casques petits ou partiellement visibles.

Figure 2
Figure 2.

Mise à l’épreuve du système

Pour vérifier l’efficacité de ces idées en pratique, les chercheurs ont entraîné et évalué le modèle sur CUMT-HelmeT, une collection publique d’images de surveillance souterraine étiquetées « casque » et « sans casque », ainsi que d’autres objets courants. Comme le jeu de données brut est relativement petit, ils l’ont multiplié par cinq en recadrant, en faisant pivoter et en éclaircissant les images pour simuler différents angles de caméra et conditions d’éclairage. Sur ce banc d’essai exigeant, YOLOv11-SRA a atteint une moyenne de précision (mAP) d’environ 84 % et un rappel proche de 80 %, surpassant nettement plusieurs détecteurs bien connus, y compris des versions récentes de YOLO, RetinaNet, SSD et Faster R-CNN. Malgré ses gains de précision, le modèle demeure compact et efficace : il emploie moins de paramètres et de calcul que la plupart des concurrents et peut analyser près de 100 images par seconde sur une carte graphique moderne, assez rapide pour des alertes en temps réel.

Voir à travers l’obscurité, la poussière et l’éblouissement

Des exemples visuels illustrent le comportement du système dans des situations qui perturbent régulièrement les méthodes anciennes : casques à moitié dissimulés, scènes éclairées uniquement par de faibles lampes, travailleurs éloignés de la caméra et reflets violents sur des surfaces brillantes. Dans chaque cas, YOLOv11-SRA produit des détections plus sûres et plus cohérentes que les modèles concurrents. Il est moins susceptible de manquer des casques petits ou faiblement éclairés et mieux à même d’éviter les fausses alertes lorsque des taches lumineuses ou des tuyaux imitent la couleur d’un casque. Des études d’ablation — où les auteurs activent ou désactivent individuellement les modules — montrent que chaque composant apporte une contribution, mais que les gains les plus importants surviennent lorsque les trois sont combinés, confirmant que la conception fonctionne comme un ensemble intégré plutôt que comme une collection d’astuces isolées.

Du prototype de recherche à des postes de travail plus sûrs

En termes accessibles, ce travail revient à donner aux caméras de la mine un « regard » plus net et plus adaptable pour repérer l’équipement de protection de base. En signalant plus fiablement les travailleurs sans casque, même sur des flux vidéo bruyants et en faible luminosité, le système YOLOv11-SRA pourrait aider les responsables à intervenir plus tôt et réduire le risque de blessures à la tête. Comme le modèle est relativement léger, il peut être déployé sur des dispositifs embarqués proches des caméras plutôt que seulement dans des centres de données éloignés. Les auteurs notent que des jeux de données d’entraînement plus vastes et un affinage supplémentaire pourraient rendre l’approche encore plus robuste, mais leurs résultats indiquent déjà une voie vers une surveillance de sécurité plus intelligente et plus évolutive dans les conditions exigeantes de l’exploitation souterraine moderne.

Citation: Wang, L., Wan, X., Shi, X. et al. A method for detecting safety helmets underground based on the YOLOv11-SRA model. Sci Rep 16, 6194 (2026). https://doi.org/10.1038/s41598-026-37148-z

Mots-clés: sécurité en exploitation souterraine, détection de casque, vision par ordinateur, surveillance en temps réel, apprentissage profond