Clear Sky Science · fr

BarkVisionAI : Nouveau jeu de données pour l’identification rapide des espèces d’arbres

· Retour à l’index

Pourquoi l’écorce des arbres et les appareils photo de téléphone comptent

Quand nous traversons une forêt, nous remarquons généralement les feuilles, les fleurs ou les canopées dominantes. Mais pendant une grande partie de l’année — ou dans des bois denses et ombragés — ces indices font défaut. Cette étude montre que la peau rugueuse et striée des arbres — leur écorce — combinée aux appareils photo des smartphones courants et à l’intelligence artificielle moderne, peut devenir un outil puissant pour identifier rapidement les espèces d’arbres et suivre la santé des forêts à travers l’Inde et, potentiellement, dans le monde.

Figure 1
Figure 1.

Une nouvelle manière de voir les forêts

Les chercheurs à l’origine de BarkVisionAI ont voulu combler une lacune majeure dans la reconnaissance des arbres. La plupart des collections photo existantes pour l’identification se concentrent sur les feuilles ou d’autres parties visibles, et les rares jeux de données d’écorces sont souvent petits, limités à quelques régions et pris dans des conditions presque identiques. Cela rend difficile le transfert des modèles informatiques entraînés sur ces données vers des forêts réelles et hétérogènes. BarkVisionAI change la donne en assemblant 156 001 photos d’écorce de 13 espèces d’arbres importantes, couvrant des types de forêts et des régions écologiques variés en Inde. Chaque image est plus qu’une photographie : elle est liée à des informations précises de localisation, de date et d’appareil, constituant une ressource riche pour l’écologie et l’intelligence artificielle.

Comment les images ont été collectées

Recueillir un si grand nombre de photos exploitables a nécessité une étroite collaboration avec le personnel forestier et un travail de terrain adapté dans deux États indiens, Himachal Pradesh et Odisha, qui couvrent ensemble huit types forestiers majeurs et neuf régions écologiques. Les gardes forestiers et les agents ont été formés à l’utilisation d’une plateforme numérique de collecte de données sur leurs téléphones, apprenant à se placer à une distance fixe du tronc, à tenir l’appareil perpendiculairement à l’écorce et à enregistrer des positions précises. La collecte s’est déroulée de janvier à décembre 2024, incluant les saisons sèches, la mousson et l’hiver. Les images ont été prises le matin, l’après-midi et le soir, sous différents éclairages et conditions météorologiques, et avec 315 modèles d’appareils distincts de 20 fabricants. Cette variation délibérée garantit que le jeu de données reflète les défis du travail en forêt plutôt que les conditions contrôlées d’un laboratoire.

Transformer une réalité désordonnée en un test équitable

Les forêts réelles introduisent de nombreux biais subtils : une espèce peut être principalement photographiée avec un téléphone précis, à un moment de la journée donné ou à une altitude particulière. Un modèle d’IA naïf pourrait « tricher » en apprenant ces raccourcis au lieu des véritables motifs d’écorce. Pour éviter ce piège, l’équipe a conçu un processus de sélection rigoureux. À partir de l’ensemble complet, ils ont constitué un sous-ensemble équilibré de 36 400 images, avec exactement 2 800 photos par espèce. Les images de chaque espèce ont été réparties selon les niveaux d’altitude, les saisons, l’état foliaire (canopée en feuille ou dépouillée), les moments de la journée et les modèles d’appareils. Ces facteurs ont été combinés en une grille fine, et les images ont été échantillonnées de sorte qu’aucune condition d’éclairage, de dispositif ou d’altitude ne domine. Le résultat n’est pas seulement un grand jeu de données, mais un ensemble conçu pour pousser les systèmes d’IA à se concentrer sur l’écorce elle-même.

Figure 2
Figure 2.

Mettre l’intelligence artificielle à l’épreuve

Avec ce jeu de données équilibré en main, les chercheurs ont entraîné plusieurs modèles populaires de reconnaissance d’image, notamment des réseaux de neurones convolutionnels bien connus et un modèle « vision transformer » moderne. Toutes les images ont été redimensionnées à des dimensions standard, puis divisées en ensembles d’entraînement, de validation et de test. Parmi les modèles, un réseau connu sous le nom de ResNet50 a obtenu les meilleurs résultats, identifiant correctement l’espèce pour environ 87 % des images de test. Un examen plus fin a montré que la précision diminuait encore dans des conditions plus difficiles — en particulier en faible lumière du soir et à des altitudes plus élevées où les environnements sont plus complexes. Ces tendances confirment que l’éclairage, la saison et l’altitude sont de réels obstacles pour l’IA, et que le contrôle de ces facteurs dans le jeu de données était essentiel pour révéler les véritables difficultés des modèles.

Ce que cela signifie pour les forêts et les outils à venir

BarkVisionAI démontre que des outils du quotidien — un smartphone et une promenade en forêt — peuvent alimenter un système sophistiqué d’identification rapide des arbres. Pour les conservationnistes et les gestionnaires forestiers, cela ouvre la voie à des cartographies d’espèces plus rapides, un meilleur suivi de la biodiversité et une surveillance plus réactive des changements environnementaux. Pour les chercheurs en IA, le jeu de données représente une référence exigeante qui capture des textures subtiles, des saisons changeantes et une diversité d’appareils, soulignant que la reconnaissance basée sur l’écorce est loin d’être résolue. Le message principal de l’étude pour le grand public est clair : en concevant soigneusement les données et les algorithmes, nous pouvons apprendre aux machines à lire les histoires écrites dans l’écorce des arbres, nous aidant à mieux comprendre et protéger les forêts.

Citation: Chhatre, A., Saini, N., Parmar, A.K. et al. BarkVisionAI: Novel dataset for rapid tree species identification. Sci Data 13, 343 (2026). https://doi.org/10.1038/s41597-026-06711-8

Mots-clés: identification des arbres, suivi des forêts, biodiversité, vision par ordinateur, forêts d’Inde