Clear Sky Science · fr
Un système de métrologie monoculaire intelligent basé sur l’ordinateur pour le saut en longueur sans élan
Pourquoi la distance du saut compte
Le saut en longueur sans élan est l’un des moyens les plus simples pour les écoles du monde entier d’évaluer la condition physique des élèves : se placer sur une ligne, sauter le plus loin possible, puis mesurer la distance. Mais dans les cours de récréation bondées, ce test apparemment simple peut devenir chaotique. Les enseignants se penchent encore avec des mètres rubans, les résultats peuvent être contestés, et enregistrer des milliers de sauts est lent et fatigant. Cette étude présente un système basé sur une caméra qui peut mesurer automatiquement et avec précision la distance de saut à partir d’une vidéo ordinaire, offrant des tests plus rapides et plus objectifs sans matériel spécialisé coûteux.
Du mètre ruban à la caméra intelligente
Les outils automatisés actuels pour le saut en longueur reposent souvent sur des capteurs à ultrasons, des tapis de pression ou des barrières lumineuses étendues sur le bac à sable. Bien qu’efficaces, ils sont coûteux à installer, sensibles aux intempéries et difficiles à maintenir à grande échelle dans les écoles. Les auteurs considèrent plutôt la tâche comme un problème de vision : si une caméra unique voit à la fois les pieds de l’athlète et la surface de saut, un logiciel devrait pouvoir déterminer la distance parcourue. Ils conçoivent une chaîne complète qui transforme la vidéo brute en une valeur de distance finale, en temps réel, en combinant les techniques modernes de vision par ordinateur et un raisonnement géométrique soigné.

Comment le système voit un saut
Le processus commence par une caméra à grande vitesse placée à quelques mètres sur le côté du tapis de saut, capturant une vidéo nette à 240 images par seconde. Le logiciel découpe d’abord cette vidéo en images individuelles et utilise un détecteur prêt à l’emploi pour repérer rapidement quand un athlète entre et sort de la scène. Dans cette fenêtre, il recherche le moment où le talon est le plus haut dans l’image (le sommet du saut) puis les images ultérieures où la position du talon cesse de changer, indiquant un atterrissage stable. Cette sélection automatique d’images clés évite d’analyser chaque image et empêche d’être perturbé par des vues partielles lorsque l’athlète n’est que partiellement dans le cadre.
Détecter le tapis, le talon et la distance réelle
Une fois l’image d’atterrissage identifiée, un modèle de vision personnalisé appelé FastNetSeg prend le relais. Ce réseau léger combine deux idées : une branche Transformer qui capture la disposition globale de la scène et une branche convolutionnelle compacte qui se concentre sur le détail local. Ensemble, elles colorient les pixels appartenant à l’athlète et ceux appartenant au tapis de saut. À partir du masque du tapis, un algorithme en trace le contour extérieur, lisse les petites irrégularités et en extrait quatre points d’angle fiables. À partir du masque de l’athlète, un autre algorithme examine le contour de la région inférieure gauche du corps, filtre les zones non pertinentes et localise le talon en utilisant la courbure — trouvant essentiellement le pli marqué où l’arrière du pied rencontre le sol. Ces quelques points clés fournissent les éléments bruts pour la mesure.
Transformer des pixels en centimètres
Parce que la caméra observe le tapis sous un angle, les distances dans l’image ne correspondent pas directement aux centimètres du monde réel : un pixel près du bord éloigné du tapis peut représenter une distance physique plus grande qu’un pixel proche de la caméra. Pour résoudre cela, le système apprend un « mappage » des coordonnées d’image vers la surface plane du tapis, en utilisant un outil géométrique standard appelé transformation projective (perspective). Connaissant la longueur et la largeur réelles du tapis, le logiciel calcule comment tout point visible — en particulier le talon — se placerait sur une carte vue de dessus du sol. Il applique ensuite une étape de correction supplémentaire basée sur un simple polynôme, ajusté à partir de sauts d’étalonnage, afin de réduire les petites erreurs systématiques restant près des bords du champ de la caméra.

Quelle précision en conditions réelles
Pour tester le système en conditions réalistes, les chercheurs ont constitué un jeu de données dédié : 1 200 sauts provenant de 200 étudiants universitaires, filmés en extérieur à différents moments de la journée et par divers temps. Des annotateurs humains ont tracé des contours au niveau des pixels des athlètes et des tapis pour entraîner et évaluer le modèle. Sur du matériel GPU moderne mais accessible, le système complet traite environ 23 images par seconde, assez rapide pour une utilisation en direct lors des tests scolaires. Surtout, lorsque ses estimations de distance sont comparées à des mesures effectuées au mètre ruban, l’erreur moyenne n’est qu’environ 0,71 centimètre — moins que la largeur d’un doigt. Supprimer l’un des modules clés, comme le filtre des athlètes incomplets, la cartographie monoculaire ou l’étape précise de détection du talon, réduit fortement la précision, soulignant l’importance de la conception complète.
Un test de saut plus clair et plus équitable
En termes simples, ce travail montre qu’une seule caméra intelligente peut remplacer les mètres rubans manuels et les dispositifs capteurs coûteux pour le saut en longueur sans élan, sans sacrifier la précision. En combinant une analyse vidéo rapide, un contour précis du sauteur et du tapis, une conversion géométrique soigneuse de l’image au sol et une dernière étape d’atténuation des erreurs, le système offre une fiabilité au centimètre près en temps réel. Avec le code et les outils d’étalonnage partagés, les écoles et les programmes sportifs pourraient déployer largement cette approche, rendant les tests de condition physique plus rapides, plus équitables et moins dépendants du jugement humain.
Citation: Kuang, G., Li, S., Liu, Y. et al. A smart monocular vision metrology system based on computer for standing long jump. Sci Rep 16, 14611 (2026). https://doi.org/10.1038/s41598-026-44523-3
Mots-clés: saut en longueur sans élan, vision par ordinateur, mesure sportive, apprentissage profond, test de condition physique