Clear Sky Science · es

Un método de detección de fatiga basado en el análisis de la postura del conductor y el estado facial

2026-03-26 · Volver al índice

Por qué los conductores cansados importan a todo el mundo

La mayoría de nosotros hemos sentido los párpados pesar en un viaje largo, pero pocos se dan cuenta de la frecuencia con la que ese momento de somnolencia se traduce en un accidente. Este artículo describe un sistema basado en cámara que vigila la cara, la postura y las manos del conductor para detectar signos tempranos de fatiga y emitir advertencias a tiempo, sin colocar sensores en el cuerpo ni cambiar la forma de conducir.

Vigilar al conductor, no solo al vehículo

Las autoridades de tráfico estiman que la fatiga influye en una gran proporción de accidentes graves en todo el mundo. Los sistemas tradicionales se han centrado en señales del vehículo, como correcciones del volante o salidas de carril, o en sensores de estilo médico que monitorizan la actividad cerebral o cardíaca. Estos métodos pueden ser costosos, incómodos o poco fiables cuando varían los conductores o las condiciones de la carretera. El estudio, en cambio, se apoya en vídeo ordinario de pequeñas cámaras dentro del coche para leer directamente el comportamiento del conductor, empleando inteligencia artificial moderna para interpretar lo que ve.

Figure 1. Las cámaras dentro del vehículo vigilan la postura, la cara y las manos del conductor para detectar somnolencia y activar una advertencia de seguridad.

Leer ojos, boca, cabeza y manos

Los investigadores primero descomponen cómo se manifiesta la conducción cansada en términos cotidianos. Las señales de advertencia incluyen parpadeos más lentos y prolongados, bostezos repetidos, cabeza caída o inclinada y manos que se alejan del volante. Usando un método de estimación de pose llamado AlphaPose, el sistema sigue 119 puntos clave en el cuerpo del conductor, especialmente alrededor de los ojos, la boca, la cabeza y las muñecas. A partir de estos puntos calcula medidas sencillas, como la apertura de ojos y boca y cuánto se ha inclinado o caído la cabeza respecto al cuello y los ojos. También comprueba si cada muñeca se mantiene cerca del volante a lo largo del tiempo o se desplaza, lo que sugiere que el conductor ya no tiene el control firme.

Ver desde varios ángulos a lo largo del tiempo

Como una sola instantánea puede ser engañosa, el sistema analiza clips de vídeo cortos en lugar de fotogramas aislados. Por ejemplo, un parpadeo normal podría parecer cierre somnoliento de ojos, y una mirada rápida al tablero podría parecer cabeceo si se ve de forma aislada. Para evitar esos errores, el método analiza cambios a lo largo de al menos 20 fotogramas consecutivos, siguiendo si las pistas de fatiga persisten. También utiliza tres vistas de cámara recogidas en el Driving Monitoring Dataset: una vista frontal de la cara, una vista lateral de la parte superior del cuerpo y una vista cercana de las manos. Juntas, estas perspectivas hacen el sistema más robusto cuando la cara está parcialmente oculta por gafas, luz solar intensa, desenfoque por movimiento o giros de la cabeza.

Figure 2. Los cambios paso a paso en ojos, inclinación de la cabeza y agarre del volante a lo largo del tiempo revelan cuándo un conductor pasa de alerta a somnoliento.

Detección más inteligente bajo el capó

Tras bambalinas, el sistema tiene dos partes principales. Primero, un detector de objetos rápido llamado YOLOv11n* localiza al conductor en cada fotograma para que AlphaPose pueda marcar los puntos clave corporales con precisión. Los autores mejoran este detector con un bloque de agrupamiento híbrido especial que ayuda a la red a entender tanto el contexto amplio como detalles finos como los ojos y los dedos. En segundo lugar, las posiciones y los puntajes de confianza de todos los puntos clave rastreados se introducen en una red LSTM (Long Short-Term Memory), un tipo de modelo adecuado para secuencias. La LSTM aprende cómo se desarrollan en el tiempo las combinaciones de cambios en ojos, boca, cabeza y manos cuando un conductor está alerta, levemente cansado o gravemente fatigado, y devuelve la probabilidad de cada nivel de fatiga para la ventana temporal actual.

Qué tan bien funciona el sistema en la práctica

El equipo probó su enfoque en un gran conjunto de datos público de vídeos dentro del coche, entrenando y evaluando los modelos con miles de imágenes y clips etiquetados. En comparación con varios métodos líderes de aprendizaje profundo, incluidas otras combinaciones de redes convolucionales, transformadores y LSTM, el marco propuesto AlphaPose*–LSTM alcanzó la mayor precisión, precisión (precision) y puntuación F1 reportadas para la clasificación de niveles de fatiga. También funcionó lo suficientemente rápido para un uso casi en tiempo real: una vez procesados los primeros 20 fotogramas, las nuevas estimaciones de fatiga pueden actualizarse aproximadamente cada 48 milisegundos, lo que es adecuado para monitorización continua en vehículos en movimiento.

Qué significa esto para la conducción cotidiana

En términos sencillos, el estudio muestra que un coche puede usar cámaras y software inteligente para vigilar señales reveladoras de un conductor cansado, combinando pequeños cambios en ojos, boca, cabeza y manos en una imagen fiable del nivel de alerta. Aunque el sistema actual está ajustado para condiciones diurnas y necesitaría adaptarse para la noche u otros entornos, los resultados sugieren que la monitorización no intrusiva basada en visión podría convertirse en una característica de seguridad práctica. Al reconocer la fatiga temprana y animar a los conductores a descansar, esta tecnología podría ayudar a prevenir muchos accidentes que hoy ocurren simplemente porque alguien estaba demasiado cansado para mantenerse plenamente despierto al volante.

Cita: Hao, Y., Sun, X., Liu, H. et al. A fatigue driving detection method based on driver posture and facial state analysis. Sci Rep 16, 15159 (2026). https://doi.org/10.1038/s41598-026-44994-4

Palabras clave: fatiga del conductor, conducción somnolienta, monitorización del conductor, visión por ordenador, seguridad vial