Clear Sky Science · es

Un método para detectar cascos de seguridad en el subsuelo basado en el modelo YOLOv11-SRA

· Volver al índice

Por qué importan controles de cascos más inteligentes en el subsuelo

En lo profundo de minas y túneles, los trabajadores dependen de los cascos de seguridad como última línea de defensa frente a desprendimientos de roca, maquinaria y techos bajos. Sin embargo, en pasajes oscuros, polvorientos y concurridos, resulta difícil para los supervisores—e incluso para las cámaras convencionales—determinar quién está correctamente protegido. Este artículo presenta un nuevo sistema de visión por computador, basado en un modelo mejorado YOLOv11-SRA, capaz de detectar automáticamente cascos y cabezas descubiertas en tiempo real, incluso cuando la iluminación es escasa, las vistas están bloqueadas y las personas están lejos de la cámara.

Figure 1
Figure 1.

Los peligros de confiar en inspecciones humanas

La inspección tradicional de cascos en minas sigue dependiendo en gran medida de personas que recorren los túneles buscando infracciones, o de molinetes y puntos de control por donde deben pasar los trabajadores. Estos métodos son lentos, cubren solo unos pocos lugares y pueden pasar por alto conductas de riesgo cuando la gente se adentra más en el subsuelo. Los cascos con sensores, etiquetas o electrónica integrada ofrecen cierta automatización, pero son costosos, difíciles de mantener en condiciones adversas y requieren modificar cada casco. A medida que la minería se expande y las jornadas laborales se alargan, estos enfoques tradicionales tienen dificultades para ofrecer la vigilancia continua y abarcar toda la mina, necesaria para prevenir accidentes.

Enseñar a las cámaras a ver cascos en condiciones adversas

Los avances recientes en aprendizaje profundo han transformado la forma en que las máquinas interpretan imágenes, especialmente para detectar objetos como coches o peatones. La familia de algoritmos YOLO es ampliamente usada porque puede analizar una imagen y localizar objetos en una sola pasada rápida—ideal para vídeo en directo. Sin embargo, las escenas subterráneas llevan a estos sistemas al límite. Los cascos pueden aparecer como pequeños parches de color en una cabeza lejana, estar medio ocultos tras tuberías o maquinaria, o confundirse con el fondo bajo una iluminación tenue e irregular. Los autores diseñaron YOLOv11-SRA específicamente para afrontar estos problemas, de modo que las cámaras de mina puedan distinguir con fiabilidad entre trabajadores protegidos y no protegidos.

Una mejora en tres partes a un motor de visión popular

El nuevo modelo preserva la estructura general de YOLOv11—entrada, backbone, neck y cabeza de detección—pero añade tres módulos especializados. Primero, el bloque SAConv permite a la red observar cada imagen con varios «niveles de zoom» a la vez, de forma que capture tanto cascos pequeños y lejanos como cascos más grandes en primer plano sin coste adicional. Segundo, el bloque RCM guía al modelo para que se enfoque en regiones largas y rectangulares que coinciden con la forma típica de la cabeza y los hombros en un túnel, ayudándole a trazar los bordes del casco incluso cuando el equipo o compañeros interfieren. Tercero, el bloque ASFF mezcla información procedente de múltiples escalas de imagen, permitiendo al sistema elegir, píxel a píxel, qué nivel describe mejor cada parte de la escena. En conjunto, estas mejoras reducen la confusión entre cascos y el ruido de fondo y afinan los contornos de cascos pequeños o parcialmente visibles.

Figure 2
Figure 2.

Poner el sistema a prueba

Para evaluar si estas ideas funcionan en la práctica, los investigadores entrenaron y probaron el modelo en CUMT-HelmeT, una colección pública de imágenes de vigilancia subterránea etiquetadas con casos de «casco» y «sin casco», además de otros objetos comunes. Dado que el conjunto original es relativamente pequeño, lo ampliaron cinco veces recortando, rotando y aclarando imágenes para imitar distintos ángulos de cámara e iluminación. En este exigente banco de pruebas, YOLOv11-SRA alcanzó una precisión media (mAP) de alrededor del 84% y una recuperación (recall) cercana al 80%, superando claramente a varios detectores conocidos, incluidas versiones más recientes de YOLO, RetinaNet, SSD y Faster R-CNN. A pesar de su mayor exactitud, el modelo sigue siendo compacto y eficiente: usa menos parámetros y menos cómputo que la mayoría de sus competidores, y puede analizar casi 100 imágenes por segundo en una tarjeta gráfica moderna, lo bastante rápido para alertas en tiempo real.

Ver a través de la oscuridad, el polvo y los reflejos

Ejemplos visuales muestran cómo se comporta el sistema en situaciones que habitualmente confunden a métodos más antiguos: cascos medio oscurecidos, escenas iluminadas solo por lámparas débiles, trabajadores lejanos de la cámara y reflejos intensos en superficies brillantes. En cada caso, YOLOv11-SRA produce detecciones más seguras y consistentes que los modelos rivales. Tiene menos probabilidad de pasar por alto cascos pequeños o tenues y muestra mejor resistencia a falsas alarmas cuando puntos brillantes o tuberías imitan los colores de un casco. Estudios de ablación—donde los autores activan o desactivan módulos individuales—muestran que cada componente aporta, pero que las mayores mejoras se obtienen cuando los tres se combinan, lo que confirma que el diseño funciona como un conjunto integrado y no como una colección de trucos aislados.

Del prototipo de investigación a turnos más seguros

En términos accesibles, este trabajo equivale a dotar a las cámaras de mina de un «ojo» más nítido y adaptable para el equipo de protección básico. Al señalar con mayor fiabilidad a los trabajadores que no llevan casco, incluso en flujos de vídeo ruidosos y con poca luz, el sistema YOLOv11-SRA podría ayudar a los supervisores a intervenir antes y reducir el riesgo de lesiones en la cabeza. Dado que el modelo es relativamente ligero, puede desplegarse en dispositivos embebidos cercanos a las cámaras en lugar de depender únicamente de centros de datos remotos. Los autores señalan que disponer de datos de entrenamiento más amplios y un mayor ajuste podría hacer el enfoque aún más robusto, pero sus resultados ya apuntan a una monitorización de seguridad más inteligente y escalable en las exigentes condiciones de la minería subterránea moderna.

Cita: Wang, L., Wan, X., Shi, X. et al. A method for detecting safety helmets underground based on the YOLOv11-SRA model. Sci Rep 16, 6194 (2026). https://doi.org/10.1038/s41598-026-37148-z

Palabras clave: seguridad en minería subterránea, detección de cascos, visión por computador, monitorización en tiempo real, aprendizaje profundo