Clear Sky Science · es
Un método ligero basado en YOLOv8n para la detección de posturas humanas anómalas
Por qué importa identificar posturas corporales inusuales
Las caídas, un dolor agudo en el pecho o que alguien se desplome en un pasillo suelen desarrollarse en pocos segundos y, si no hay nadie cerca, la ayuda puede llegar demasiado tarde. Este artículo presenta un sistema de inteligencia artificial compacto que puede analizar vídeo ordinario procedente de cámaras de seguridad o de residencias y señalar automáticamente posturas peligrosas o anómalas en tiempo real. Al diseñar el software para que sea preciso y ligero, los autores pretenden llevar la detección fiable de caídas y eventos de salud a dispositivos cotidianos, desde monitores hospitalarios hasta cámaras de bajo coste en hogares de personas mayores.
De cámaras sencillas a una vigilancia más inteligente
Los sistemas de monitorización modernos ya emplean visión por ordenador para detectar personas y seguir sus movimientos, pero las posturas inusuales son especialmente difíciles de identificar. Una persona puede verse muy distinta al estar de pie, sujetándose el pecho, vomitando o tumbada en el suelo; estos sucesos son breves, variados y a menudo están parcialmente ocultos por muebles o por una iluminación deficiente. Los algoritmos existentes pueden ser bastante precisos, pero suelen ser voluminosos y lentos, requiriendo hardware potente y ajustes cuidadosos. Los autores se centran en hacer la detección rápida y ahorradora en recursos de cómputo, de modo que pueda ejecutarse en tarjetas gráficas comunes o incluso en dispositivos embebidos sin sacrificar la fiabilidad.

Un cerebro más esbelto para reconocer posturas de riesgo
El núcleo del trabajo es una versión mejorada de un modelo popular de detección de objetos llamado YOLOv8n. Los investigadores construyen una variante más ligera y especializada que denominan PSD‑YOLOv8n. En primer lugar, añaden un nuevo módulo de atención, PoseMSA, que ayuda a la red a concentrarse en las partes del cuerpo de una persona que aportan más información, ignorando fondos desordenados. Lo hace con operaciones simplificadas que imitan mirar tanto a lo largo de la imagen como a través de las diferentes capas de características, potenciando las señales relevantes para la postura y manteniendo bajo el número de cálculos. En segundo lugar, rediseñan cómo el modelo «vuelve a acercarse» a los detalles mediante un bloque de sobremuestreo KA‑Sample, que aprende a afinar las zonas alrededor de puntos corporales clave —como cabeza, torso y extremidades— para que las posturas torcidas o colapsadas destaquen con mayor claridad.
Cajas más nítidas y decisiones más claras
Al reconocer que las posturas anómalas a menudo se diluyen en su entorno —piense en una persona extendida en parte bajo una mesa—, los autores también revisan la etapa final de decisión, conocida como la cabeza de detección. Su módulo Detect‑PSA combina información de múltiples escalas y aplica una forma probabilística de dibujar los cuadros delimitadores. En lugar de adivinar un único borde rígido que marque el inicio y el final de una persona, el sistema representa cada lado de la caja como una pequeña distribución de posiciones plausibles y luego las promedia. Este enfoque estabiliza los contornos cuando las extremidades están acortadas por la perspectiva, oculta o estiradas a lo largo del suelo, dando lugar a cajas que se ajustan más estrechamente a la verdad anotada por humanos en escenas difíciles.

Poniendo el sistema a prueba
Para evaluar el funcionamiento práctico de su diseño, el equipo creó una colección de imágenes dedicada, el SSHDataset, construida a partir de vídeos interiores grabados desde múltiples ángulos que muestran personas en cuatro estados: normal, dolor en el pecho, vómitos y caída. Tras un etiquetado manual cuidadoso y aumentos de datos, entrenaron PSD‑YOLOv8n y una serie de modelos rivales bajo las mismas condiciones. En métricas de precisión estándar, su método alcanzó una puntuación de detección del 97,8% con un umbral de solapamiento común y mantuvo un rendimiento elevado incluso bajo criterios más estrictos. Al mismo tiempo, utilizó solo alrededor de dos millones de parámetros y un archivo de pesos de 4,5 megabytes —aproximadamente un tercio menos de parámetros y más de un tercio menos de cómputo que el YOLOv8n original— mientras funcionaba a más de 80 fotogramas por segundo. Las pruebas en un conjunto de datos público e independiente de detección de caídas mostraron que las mejoras se mantenían en datos nuevos, con mejoras particularmente destacadas para la detección de caídas reales.
Qué implica esto para la seguridad cotidiana
En términos sencillos, el estudio entrega un «salvavidas» digital compacto que puede vigilar vídeo en directo y detectar con fiabilidad cuando la postura corporal de alguien indica peligro. Al reconfigurar cuidadosamente cómo el modelo se centra en las regiones del cuerpo, reconstruye detalles finos y dibuja cajas alrededor de las personas, los autores consiguen una combinación poco común de alta precisión, velocidad y tamaño reducido. Un sistema así podría integrarse en monitores hospitalarios, hubs de hogar inteligente o cámaras en espacios públicos para activar alertas oportunas por caídas o angustia súbita, incluso en habitaciones desordenadas y con iluminación variable. A medida que el enfoque se refine y se extienda a secuencias de vídeo más largas y a nuevos entornos, podría apoyar una nueva generación de guardianes discretos y siempre activos que ayuden a mantener a las personas vulnerables más seguras sin exigir supervisión humana constante.
Cita: Li, G., Zhang, J., Ji, Q. et al. A lightweight YOLOv8n-based method for human abnormal posture detection. Sci Rep 16, 7222 (2026). https://doi.org/10.1038/s41598-026-37903-2
Palabras clave: detección de caídas, postura humana, visión por ordenador, IA ligera, cuidado de personas mayores