Clear Sky Science · sv
BarkVisionAI: Nytt dataset för snabb identifiering av trädarter
Varför trädbark och mobilkameror spelar roll
När vi går genom en skog lägger vi vanligtvis märke till löv, blommor eller höga kronor. Men under stora delar av året—or i tät, skuggig skog—saknas ofta de ledtrådarna. Denna studie visar att trädens grova, mönstrade hud—barken—i kombination med vanliga mobilkameror och modern artificiell intelligens kan bli ett kraftfullt verktyg för att snabbt identifiera trädarter och följa skogars hälsa i hela Indien och potentiellt i resten av världen.

Ett nytt sätt att se skogar
Forskarna bakom BarkVisionAI ville täppa till ett stort gap i hur vi känner igen träd. De flesta befintliga fotodatabaser för trädidentifiering fokuserar på blad eller andra synliga delar, och de få barkbildsdatabaser som finns är ofta små, hämtade från begränsade regioner och tagna under nästan identiska förhållanden. Det gör det svårt för datorbaserade modeller som tränats på dem att fungera i röriga, verkliga skogar. BarkVisionAI ändrar detta genom att sammanställa 156 001 barkbilder från 13 viktiga trädarter över olika skogstyper och ekologiska regioner i Indien. Varje bild är mer än enbart en bild: den är kopplad till exakt plats, tid och kamerainformation och skapar en rik resurs för både ekologi och artificiell intelligens.
Hur bilderna samlades in
Att samla in så många användbara foton krävde nära samarbete med skogspersonal och specialanpassat fältarbete i två indiska delstater, Himachal Pradesh och Odisha, som tillsammans täcker åtta stora skogstyper och nio ekologiska regioner. Skogsvakter och tjänstemän utbildades i att använda en digital datainsamlingsplattform på sina telefoner, och lärde sig stå på ett bestämt avstånd från stammen, hålla kameran vinkelrät mot barken och registrera exakta positioner. Datainsamlingen pågick från januari till december 2024 och spände över torrperioder, monsuner och vinter. Bilder togs på morgon, eftermiddag och kväll, under skiftande ljus- och väderförhållanden, och med 315 olika kamerasystem från 20 tillverkare. Denna genomtänkta variation säkerställer att datasetet speglar verkliga utmaningar vid arbete i skog snarare än de kontrollerade förhållandena i ett laboratorium.
Att förvandla rörig verklighet till ett rättvist test
Verkliga skogar introducerar många subtila snedvridningar: kanske en art fotograferas mest med en viss telefon, vid en viss tid på dygnet eller på en viss höjd. En naiv AI-modell skulle kunna ”fuska” genom att lära sig dessa genvägar istället för de verkliga barkmönstren. För att undvika den fallgropen utformade teamet en noggrann urvalsprocess. Från hela samlingen byggde de ett balanserat delset om 36 400 bilder, med exakt 2 800 foton per art. Varje arts bilder fördelades över höjdnivåer, årstider, bladförhållanden (om kronan var lövfylld eller kal), tid på dygnet och kamermodeller. Dessa faktorer kombinerades i ett fint graderat rutnät, och bilderna provtogs så att inget enskilt ljusförhållande, enhet eller höjdnivå skulle dominera. Resultatet är inte bara ett stort dataset utan ett som är utformat för att tvinga AI-system att uppmärksamma barken i sig.

Att sätta artificiell intelligens på prov
Med detta balanserade dataset i handen tränade forskarna flera populära bildigenkänningsmodeller, inklusive välkända konvolutionsneuronätverk och en modern ”vision transformer”-modell. Alla bilder skalades till standarddimensioner och delades sedan in i tränings-, validerings- och testset. Bland modellerna presterade ett nätverk känt som ResNet50 bäst och identifierade rätt art i cirka 87 % av testbilderna. En närmare granskning visade att noggrannheten ändå sjönk under svårare förhållanden—särskilt i lågt kvällsljus och på högre höjder där miljöerna är mer komplexa. Dessa mönster bekräftade att ljus, årstid och höjd är verkliga hinder för AI, och att kontroll över dessa faktorer i datasetet var nödvändig för att avslöja var modeller verkligen har svårigheter.
Vad detta betyder för skogar och framtida verktyg
BarkVisionAI visar att vardagliga verktyg—en smartphone och en skogspromenad—kan mata ett avancerat system för snabb trädidentifiering. För naturvårdare och skogsförvaltare öppnar detta dörren för snabbare kartläggning av arter, bättre uppföljning av biologisk mångfald och mer tidsenlig övervakning av miljöförändringar. För AI-forskare representerar datasetet en krävande referenspunkt som fångar upp subtila texturer, skiftande årstider och olika enheter, och påminner om att barkbaserad igenkänning långt ifrån är ett löst problem. Studiets huvudbudskap för icke-specialister är tydligt: genom att noggrant utforma både data och algoritmer kan vi lära maskiner att läsa de berättelser som skrivs i trädens bark och därigenom bättre förstå och skydda skogar.
Citering: Chhatre, A., Saini, N., Parmar, A.K. et al. BarkVisionAI: Novel dataset for rapid tree species identification. Sci Data 13, 343 (2026). https://doi.org/10.1038/s41597-026-06711-8
Nyckelord: trädidentifiering, skogsövervakning, biologisk mångfald, datorseende, Indiens skogar