Clear Sky Science · nl
BarkVisionAI: Nieuwe dataset voor snelle identificatie van boomsoorten
Waarom boomschors en telefooncamera's ertoe doen
Wanneer we door een bos lopen, vallen ons meestal bladeren, bloemen of hoge kruinen op. Maar het grootste deel van het jaar — of in dichte, beschaduwde wouden — ontbreken die aanwijzingen. Deze studie toont aan dat de ruwe, gevarieerde ‘huid’ van bomen — hun schors — gecombineerd met alledaagse smartphonecamera’s en moderne kunstmatige intelligentie een krachtig instrument kan zijn om snel boomsoorten te identificeren en de gezondheid van bossen in India en mogelijk wereldwijd te volgen.

Een nieuwe manier om naar bossen te kijken
De onderzoekers achter BarkVisionAI wilden een belangrijke leemte opvullen in hoe we bomen herkennen. De meeste bestaande fotocollecties voor boomidentificatie richten zich op bladeren of andere zichtbare onderdelen, en de weinige datasets met schorsfoto’s zijn vaak klein, van beperkte regio’s en gemaakt onder vrijwel identieke omstandigheden. Daardoor is het moeilijk voor computermodellen die daarop zijn getraind om in rommelige, echte bossen te presteren. BarkVisionAI verandert dat door 156.001 schorsfoto’s samen te brengen van 13 belangrijke boomsoorten, verspreid over diverse bostypes en ecologische regio’s in India. Elke foto is meer dan een beeld: ze is gekoppeld aan nauwkeurige locatie-, tijd- en camera-informatie, wat een rijke bron oplevert voor zowel ecologie als kunstmatige intelligentie.
Hoe de beelden zijn verzameld
Het verzamelen van zo veel bruikbare foto’s vergde nauwe samenwerking met boswachters en gericht veldwerk in twee Indiase deelstaten, Himachal Pradesh en Odisha, die samen acht belangrijke bostypes en negen ecologische regio’s omvatten. Boswachters en functionarissen werden getraind in het gebruik van een digitaal dataverzamelplatform op hun telefoons, en leerden hoe ze op een vaste afstand van de stam moesten staan, de camera haaks op de schors moesten houden en nauwkeurige locaties moesten registreren. De dataverzameling liep van januari tot december 2024 en omvatte droge seizoenen, moesson en winter. Foto’s werden ’s ochtends, in de middag en ’s avonds genomen, onder verschillende licht- en weersomstandigheden, met 315 verschillende cameramodellen van 20 fabrikanten. Deze bewuste variatie zorgt ervoor dat de dataset de uitdagingen uit de echte wereld in bossen weerspiegelt in plaats van de gecontroleerde omstandigheden van een laboratorium.
De rommelige realiteit omzetten in een eerlijke test
In echte bossen sluipen veel subtiele vertekeningen binnen: misschien wordt een soort vooral met een bepaald telefoonmodel gefotografeerd, op een bepaald tijdstip van de dag of op een bepaalde hoogte. Een naïef AI-model zou kunnen “smokkelen” door deze kortere wegen te leren in plaats van de echte schorspatronen. Om die val te voorkomen, ontwierp het team een zorgvuldig selectieproces. Uit de volledige verzameling bouwden ze een gebalanceerde subset van 36.400 afbeeldingen, met precies 2.800 foto’s per soort. De beelden per soort werden verspreid over hoogteverschillen, seizoenen, bladcondities (of de kroon vol blad was of kaal), tijdstippen en cameramodellen. Deze factoren werden gecombineerd in een fijnmazig raster, en er werden afbeeldingen geselecteerd zodat geen enkele lichtconditie, apparaat of hoogte zou domineren. Het resultaat is niet alleen een grote dataset, maar een die is ontworpen om AI-systemen te dwingen de aandacht op de schors zelf te richten.

Kunstmatige intelligentie op de proef stellen
Met deze gebalanceerde dataset trainden de onderzoekers verschillende gangbare beeldherkenningsmodellen, waaronder bekende convolutionele neurale netwerken en een modern ‘vision transformer’-model. Alle afbeeldingen werden naar standaardafmetingen geschaald en vervolgens verdeeld in trainings-, validatie- en testsets. Onder de modellen presteerde een netwerk bekend als ResNet50 het beste, met een juiste soortidentificatie voor ongeveer 87% van de testafbeeldingen. Nader onderzoek liet zien dat de nauwkeurigheid nog daalde onder moeilijkere omstandigheden — vooral bij zwak avondlicht en op grotere hoogtes waar de omgevingen complexer zijn. Deze patronen bevestigden dat licht, seizoen en hoogte echte obstakels vormen voor AI, en dat het beheersen van deze factoren in de dataset essentieel was om te laten zien waar modellen daadwerkelijk moeite mee hebben.
Wat dit betekent voor bossen en toekomstige hulpmiddelen
BarkVisionAI toont aan dat alledaagse middelen — een smartphone en een wandeling in het bos — een geavanceerd systeem kunnen voeden voor snelle boomidentificatie. Voor natuurbeschermers en bosbeheerders opent dit de deur naar snellere kaartlegging van soorten, betere monitoring van biodiversiteit en meer tijdige detectie van milieuveranderingen. Voor AI-onderzoekers biedt de dataset een veeleisende benchmark die subtiele texturen, wisselende seizoenen en diverse apparaten vastlegt, en benadrukt dat schorsgebaseerde herkenning nog lang geen uitgemaakte zaak is. De belangrijkste boodschap van de studie voor niet-specialisten is helder: door zowel data als algoritmen zorgvuldig te ontwerpen, kunnen we machines leren de verhalen in boomschors te lezen en ons helpen bossen effectiever te begrijpen en te beschermen.
Bronvermelding: Chhatre, A., Saini, N., Parmar, A.K. et al. BarkVisionAI: Novel dataset for rapid tree species identification. Sci Data 13, 343 (2026). https://doi.org/10.1038/s41597-026-06711-8
Trefwoorden: boomidentificatie, bosmonitoring, biodiversiteit, computer vision, bossen in India