Clear Sky Science · es
Detección del comportamiento del ganado mediante vídeo para el desarrollo de gemelos digitales en sistemas lecheros de precisión
Por qué importa observar a las vacas
En las explotaciones lecheras modernas, saber qué hace cada vaca—comer, descansar, beber o rumiar—está directamente relacionado con la producción de leche, la salud y el bienestar. Sin embargo, los ganaderos rara vez disponen del tiempo para vigilar a cada animal las 24 horas. Este estudio muestra cómo cámaras de granero convencionales, combinadas con visión por ordenador avanzada, pueden rastrear automáticamente la vida diaria de las vacas e incorporar esa información en un “gemelo virtual” del rebaño. Estos sistemas podrían ayudar a afinar la nutrición, detectar enfermedades antes y gestionar los rebaños con mayor eficacia, todo ello sin acoplar aparatos a los animales.

Del granero real al rebaño virtual
Los investigadores se propusieron construir los “ojos y oídos” conductuales para un gemelo digital lechero—un modelo virtual de un establo y sus vacas que se actualiza casi en tiempo real. Se centraron en siete actividades cotidianas que importan para la salud y la producción: estar de pie, estar tumbada, alimentarse estando de pie, alimentarse estando tumbada, beber y rumiar (masticar el bolo) estando de pie o tumbada. En lugar de depender de sensores portátiles, emplearon cámaras de seguridad cenitales y en ángulo en un establo comercial tipo atadura que alojaba unas 80 vacas Holstein. El vídeo continuo se convirtió en clips cortos de 10 segundos centrados en vacas individuales, formando el material bruto para enseñar a los ordenadores a reconocer qué hacía cada animal.
Enseñar a los ordenadores a reconocer el comportamiento bovino
Transformar las grabaciones en bruto en datos útiles requirió varios pasos. Primero, un sistema de detección de objetos localizó automáticamente las vacas en cada fotograma, y un algoritmo de seguimiento mantuvo la identidad de cada vaca coherente a medida que se movía, incluso cuando estaba parcialmente oculta. El programa recortó y redimensionó cada vaca en clips de vídeo estandarizados. Expertos humanos etiquetaron casi 5.000 de estos clips con el comportamiento correcto, usando reglas visuales claras y verificando el trabajo entre sí para garantizar la coherencia. Dado que las vacas pasan naturalmente más tiempo tumbadas o de pie que bebiendo o rumiando, el equipo amplió cuidadosamente los comportamientos menos frecuentes mediante “aumento” digital—pequeños volteos, recortes, cambios de brillo y ajustes temporales—para crear un conjunto de entrenamiento más equilibrado de unas 9.600 muestras.
Cómo el sistema percibe patrones a lo largo del tiempo
Para detectar los comportamientos, el equipo comparó dos familias líderes de modelos de análisis de vídeo. Uno, llamado SlowFast, imita dos velocidades de visión a la vez: una vía “lenta” que capta la postura en tramos más largos, y una vía “rápida” que se centra en movimientos rápidos de la cabeza. El otro, TimeSformer, emplea mecanismos de atención desarrollados originalmente para modelos de lenguaje para mirar a través del espacio y el tiempo, decidiendo qué partes de cada fotograma y qué momentos de un clip son los más relevantes. Cuando se entrenó con los vídeos del establo, TimeSformer rindió ligeramente mejor que SlowFast, clasificando correctamente los comportamientos en torno al 85% de los casos y con suficiente rapidez para uso en tiempo real en una sola tarjeta gráfica moderna. Las visualizaciones mostraron que el modelo se centraba de forma natural en la cabeza y el hocico de la vaca durante la alimentación y la ingesta de agua, y en el torso y las patas para identificar tumbada o de pie, coincidiendo con el juicio de un observador humano.
De las secuencias de comportamiento a las decisiones en la granja
Una vez que el sistema pudo reconocer comportamientos clip por clip, los investigadores construyeron una canalización completa que funciona de forma continua sobre el vídeo del establo. El programa sigue a cada vaca a lo largo del tiempo, aplica una ventana deslizante al vídeo y suaviza pasos en falso momentáneos para que breves errores no aparezcan como cambios de estado rápidos. El resultado es una cronología limpia para cada animal: cuándo se alimentó, estuvo tumbada, de pie, bebió o rumiaba, junto con la duración de cada episodio y la confianza del sistema. Estos registros estructurados pueden ser leídos directamente por modelos nutricionales de la granja que estiman la ingesta a partir del tiempo de alimentación, y pueden impulsar un gemelo digital 3D en un entorno similar a un videojuego que muestra vacas virtuales que reflejan las acciones de sus homólogas reales. En un estudio de caso de 24 horas de una vaca, el sistema reconstruyó su jornada completa de actividades y usó la duración de la alimentación más información básica del animal para estimar la cantidad de alimento seco que probablemente consumió.

Qué significa esto para las granjas lecheras del futuro
El estudio demuestra que cámaras económicas y modelos de vídeo bien diseñados pueden ofrecer registros continuos de comportamiento por vaca lo bastante precisos como para servir de capa sensorial a un gemelo digital lechero. Aunque el trabajo aún no automatiza decisiones—como cambiar raciones o alertar al personal sobre enfermedades—proporciona el flujo de entrada crucial del que dependen esas herramientas de alto nivel. A medida que el enfoque se extienda a diseños de establos más abiertos y se combine con otros sensores, los ganaderos podrían obtener una visión detallada y permanente de los ritmos diarios de sus animales, permitiendo una gestión más suave y precisa que beneficie tanto a las vacas como al medio ambiente.
Cita: Rao, S., Garcia, E. & Neethirajan, S. Video-based cattle behaviour detection for digital twin development in precision dairy systems. npj Vet. Sci. 1, 3 (2026). https://doi.org/10.1038/s44433-026-00004-x
Palabras clave: ganadería de precisión, visión por ordenador, comportamiento del ganado lechero, gemelo digital, monitorización del bienestar animal