Clear Sky Science · it

BarkVisionAI: Nuovo dataset per l’identificazione rapida delle specie arboree

· Torna all'indice

Perché la corteccia degli alberi e le fotocamere degli smartphone contano

Quando attraversiamo una foresta, di solito notiamo foglie, fiori o chiome imponenti. Ma per gran parte dell’anno — o in boschi fitti e ombreggiati — questi indizi possono mancare. Questo studio dimostra che la pelle ruvida e con motivi degli alberi — la loro corteccia — combinata con le fotocamere di uso quotidiano degli smartphone e l’intelligenza artificiale moderna, può diventare uno strumento potente per identificare rapidamente le specie arboree e monitorare la salute delle foreste in India e, potenzialmente, nel mondo.

Figure 1
Figura 1.

Un nuovo modo di osservare le foreste

I ricercatori dietro BarkVisionAI si sono posti l’obiettivo di colmare una lacuna importante nel modo in cui riconosciamo gli alberi. La maggior parte delle raccolte fotografiche esistenti per l’identificazione si concentra su foglie o altre parti visibili, e i pochi dataset di immagini della corteccia sono spesso di piccole dimensioni, provenienti da regioni limitate e scattati in condizioni quasi identiche. Questo rende difficile per i modelli computazionali addestrati su tali dati funzionare in foreste reali e disordinate. BarkVisionAI cambia le regole assemblando 156.001 foto di corteccia relative a 13 specie arboree rilevanti, distribuite in diversi tipi forestali e regioni ecologiche in India. Ogni immagine è più di una semplice foto: è collegata a informazioni precise su posizione, orario e fotocamera, creando una risorsa ricca sia per l’ecologia sia per l’intelligenza artificiale.

Come sono state raccolte le immagini

Raccogliere un numero così elevato di foto utili ha richiesto una stretta collaborazione con il personale forestale e lavori sul campo mirati in due stati indiani, Himachal Pradesh e Odisha, che insieme rappresentano otto principali tipi forestali e nove regioni ecologiche. Guardie forestali e funzionari sono stati addestrati all’uso di una piattaforma digitale di raccolta dati sul loro telefono, imparando a mantenere una distanza fissa dal tronco, tenere la fotocamera perpendicolare alla corteccia e registrare posizioni accurate. La raccolta dei dati è stata effettuata da gennaio a dicembre 2024, coprendo stagioni secche, monsone e inverno. Le immagini sono state scattate al mattino, al pomeriggio e alla sera, in diverse condizioni di luce e meteo, utilizzando 315 modelli di fotocamera distinti prodotti da 20 fabbricanti. Questa variazione deliberata garantisce che il dataset rifletta le sfide del mondo reale in foresta piuttosto che le condizioni controllate di un laboratorio.

Trasformare la realtà disordinata in un test equo

Le foreste reali introducono molti bias sottili: forse una specie è fotografata per lo più con un telefono specifico, a una certa ora del giorno o a una certa altitudine. Un modello di IA ingenuo potrebbe “barare” imparando queste scorciatoie invece di cogliere i veri motivi della corteccia. Per evitare questo rischio, il team ha ideato un processo di selezione accurato. Dalla raccolta completa hanno costruito un sottoinsieme bilanciato di 36.400 immagini, con esattamente 2.800 foto per specie. Le immagini di ciascuna specie sono state distribuite su diversi livelli di altitudine, stagioni, condizioni delle foglie (se la chioma era in piena foglia o spoglia), orari del giorno e modelli di fotocamera. Questi fattori sono stati combinati in una griglia dettagliata e le immagini sono state campionate in modo che nessuna singola condizione di illuminazione, dispositivo o altitudine dominasse. Il risultato non è solo un dataset ampio, ma uno creato per spingere i sistemi di IA a concentrarsi effettivamente sulla corteccia.

Figure 2
Figura 2.

Mettere alla prova l’intelligenza artificiale

Con questo dataset bilanciato in mano, i ricercatori hanno addestrato diversi modelli popolari di riconoscimento delle immagini, incluse reti neurali convoluzionali ben note e un moderno modello “vision transformer”. Tutte le immagini sono state ridimensionate a dimensioni standard e poi suddivise in set di addestramento, validazione e test. Tra i modelli, una rete nota come ResNet50 ha ottenuto le migliori prestazioni, identificando correttamente le specie in circa l’87% delle immagini di test. Un’analisi più approfondita ha mostrato che l’accuratezza calava ancora in condizioni più difficili — specialmente in scarsa luce serale e ad altitudini maggiori dove gli ambienti sono più complessi. Questi schemi hanno confermato che illuminazione, stagione e altitudine sono ostacoli reali per l’IA e che controllare questi fattori nel dataset era essenziale per mettere in luce dove i modelli hanno davvero difficoltà.

Cosa significa per le foreste e gli strumenti del futuro

BarkVisionAI dimostra che strumenti di uso quotidiano — uno smartphone e una passeggiata nel bosco — possono alimentare un sistema sofisticato per l’identificazione rapida degli alberi. Per conservazionisti e gestori forestali, questo apre la strada a mappature più rapide delle specie, a un miglior monitoraggio della biodiversità e a controlli più tempestivi dei cambiamenti ambientali. Per i ricercatori di IA, il dataset rappresenta un benchmark impegnativo che cattura trame sottili, stagioni mutevoli e dispositivi diversi, evidenziando che il riconoscimento basato sulla corteccia è ancora lontano dall’essere risolto. Il messaggio principale dello studio per il pubblico non specialistico è chiaro: progettando con cura dati e algoritmi, possiamo insegnare alle macchine a leggere le storie scritte nella corteccia degli alberi, aiutandoci a comprendere e proteggere le foreste in modo più efficace.

Citazione: Chhatre, A., Saini, N., Parmar, A.K. et al. BarkVisionAI: Novel dataset for rapid tree species identification. Sci Data 13, 343 (2026). https://doi.org/10.1038/s41597-026-06711-8

Parole chiave: identificazione degli alberi, monitoraggio forestale, biodiversità, visione artificiale, foreste indiane