Clear Sky Science · es
Un método para detectar cascos de seguridad en el subsuelo basado en el modelo YOLOv11-SRA
Por qué importan controles de cascos más inteligentes en el subsuelo
En lo profundo de minas y túneles, los trabajadores dependen de los cascos de seguridad como última línea de defensa frente a desprendimientos de roca, maquinaria y techos bajos. Sin embargo, en pasajes oscuros, polvorientos y concurridos, resulta difícil para los supervisores—e incluso para las cámaras convencionales—determinar quién está correctamente protegido. Este artículo presenta un nuevo sistema de visión por computador, basado en un modelo mejorado YOLOv11-SRA, capaz de detectar automáticamente cascos y cabezas descubiertas en tiempo real, incluso cuando la iluminación es escasa, las vistas están bloqueadas y las personas están lejos de la cámara.

Los peligros de confiar en inspecciones humanas
La inspección tradicional de cascos en minas sigue dependiendo en gran medida de personas que recorren los túneles buscando infracciones, o de molinetes y puntos de control por donde deben pasar los trabajadores. Estos métodos son lentos, cubren solo unos pocos lugares y pueden pasar por alto conductas de riesgo cuando la gente se adentra más en el subsuelo. Los cascos con sensores, etiquetas o electrónica integrada ofrecen cierta automatización, pero son costosos, difíciles de mantener en condiciones adversas y requieren modificar cada casco. A medida que la minería se expande y las jornadas laborales se alargan, estos enfoques tradicionales tienen dificultades para ofrecer la vigilancia continua y abarcar toda la mina, necesaria para prevenir accidentes.
Enseñar a las cámaras a ver cascos en condiciones adversas
Los avances recientes en aprendizaje profundo han transformado la forma en que las máquinas interpretan imágenes, especialmente para detectar objetos como coches o peatones. La familia de algoritmos YOLO es ampliamente usada porque puede analizar una imagen y localizar objetos en una sola pasada rápida—ideal para vídeo en directo. Sin embargo, las escenas subterráneas llevan a estos sistemas al límite. Los cascos pueden aparecer como pequeños parches de color en una cabeza lejana, estar medio ocultos tras tuberías o maquinaria, o confundirse con el fondo bajo una iluminación tenue e irregular. Los autores diseñaron YOLOv11-SRA específicamente para afrontar estos problemas, de modo que las cámaras de mina puedan distinguir con fiabilidad entre trabajadores protegidos y no protegidos.
Una mejora en tres partes a un motor de visión popular
El nuevo modelo preserva la estructura general de YOLOv11—entrada, backbone, neck y cabeza de detección—pero añade tres módulos especializados. Primero, el bloque SAConv permite a la red observar cada imagen con varios «niveles de zoom» a la vez, de forma que capture tanto cascos pequeños y lejanos como cascos más grandes en primer plano sin coste adicional. Segundo, el bloque RCM guía al modelo para que se enfoque en regiones largas y rectangulares que coinciden con la forma típica de la cabeza y los hombros en un túnel, ayudándole a trazar los bordes del casco incluso cuando el equipo o compañeros interfieren. Tercero, el bloque ASFF mezcla información procedente de múltiples escalas de imagen, permitiendo al sistema elegir, píxel a píxel, qué nivel describe mejor cada parte de la escena. En conjunto, estas mejoras reducen la confusión entre cascos y el ruido de fondo y afinan los contornos de cascos pequeños o parcialmente visibles.

Poner el sistema a prueba
Para evaluar si estas ideas funcionan en la práctica, los investigadores entrenaron y probaron el modelo en CUMT-HelmeT, una colección pública de imágenes de vigilancia subterránea etiquetadas con casos de «casco» y «sin casco», además de otros objetos comunes. Dado que el conjunto original es relativamente pequeño, lo ampliaron cinco veces recortando, rotando y aclarando imágenes para imitar distintos ángulos de cámara e iluminación. En este exigente banco de pruebas, YOLOv11-SRA alcanzó una precisión media (mAP) de alrededor del 84% y una recuperación (recall) cercana al 80%, superando claramente a varios detectores conocidos, incluidas versiones más recientes de YOLO, RetinaNet, SSD y Faster R-CNN. A pesar de su mayor exactitud, el modelo sigue siendo compacto y eficiente: usa menos parámetros y menos cómputo que la mayoría de sus competidores, y puede analizar casi 100 imágenes por segundo en una tarjeta gráfica moderna, lo bastante rápido para alertas en tiempo real.
Ver a través de la oscuridad, el polvo y los reflejos
Ejemplos visuales muestran cómo se comporta el sistema en situaciones que habitualmente confunden a métodos más antiguos: cascos medio oscurecidos, escenas iluminadas solo por lámparas débiles, trabajadores lejanos de la cámara y reflejos intensos en superficies brillantes. En cada caso, YOLOv11-SRA produce detecciones más seguras y consistentes que los modelos rivales. Tiene menos probabilidad de pasar por alto cascos pequeños o tenues y muestra mejor resistencia a falsas alarmas cuando puntos brillantes o tuberías imitan los colores de un casco. Estudios de ablación—donde los autores activan o desactivan módulos individuales—muestran que cada componente aporta, pero que las mayores mejoras se obtienen cuando los tres se combinan, lo que confirma que el diseño funciona como un conjunto integrado y no como una colección de trucos aislados.
Del prototipo de investigación a turnos más seguros
En términos accesibles, este trabajo equivale a dotar a las cámaras de mina de un «ojo» más nítido y adaptable para el equipo de protección básico. Al señalar con mayor fiabilidad a los trabajadores que no llevan casco, incluso en flujos de vídeo ruidosos y con poca luz, el sistema YOLOv11-SRA podría ayudar a los supervisores a intervenir antes y reducir el riesgo de lesiones en la cabeza. Dado que el modelo es relativamente ligero, puede desplegarse en dispositivos embebidos cercanos a las cámaras en lugar de depender únicamente de centros de datos remotos. Los autores señalan que disponer de datos de entrenamiento más amplios y un mayor ajuste podría hacer el enfoque aún más robusto, pero sus resultados ya apuntan a una monitorización de seguridad más inteligente y escalable en las exigentes condiciones de la minería subterránea moderna.
Cita: Wang, L., Wan, X., Shi, X. et al. A method for detecting safety helmets underground based on the YOLOv11-SRA model. Sci Rep 16, 6194 (2026). https://doi.org/10.1038/s41598-026-37148-z
Palabras clave: seguridad en minería subterránea, detección de cascos, visión por computador, monitorización en tiempo real, aprendizaje profundo