Clear Sky Science · pl
BarkVisionAI: Nowy zbiór danych do szybkiej identyfikacji gatunków drzew
Dlaczego kora drzew i aparaty w telefonach mają znaczenie
Kiedy spacerujemy po lesie, zwykle zauważamy liście, kwiaty czy rozłożyste korony drzew. Jednak przez dużą część roku — albo w gęstych, zacienionych zaroślach — te wskazówki mogą być niedostępne. Badanie to pokazuje, że chropowata, wzorzysta „skóra” drzew — ich kora — w połączeniu z codziennymi aparatami w smartfonach i nowoczesną sztuczną inteligencją może stać się potężnym narzędziem do szybkiej identyfikacji gatunków drzew oraz monitorowania stanu lasów w Indiach, a potencjalnie także na całym świecie.

Nowy sposób postrzegania lasów
Naukowcy stojący za BarkVisionAI postawili sobie za cel wypełnienie istotnej luki w rozpoznawaniu drzew. Większość istniejących zbiorów zdjęć do identyfikacji drzew skupia się na liściach lub innych widocznych częściach, a nieliczne zbiory zdjęć kory są zwykle małe, pochodzą z ograniczonych regionów i wykonano je w niemal identycznych warunkach. Utrudnia to działanie modeli komputerowych wytrenowanych na takich danych w trudnych, rzeczywistych warunkach leśnych. BarkVisionAI zmienia to, gromadząc 156 001 zdjęć kory z 13 istotnych gatunków drzew zróżnicowanych typów lasu i regionów ekologicznych w Indiach. Każde zdjęcie to więcej niż obraz: powiązano je z dokładną lokalizacją, czasem i informacją o aparacie, tworząc bogate źródło danych dla ekologii i sztucznej inteligencji.
Jak zbierano obrazy
Zebranie tak dużej liczby użytecznych zdjęć wymagało ścisłej współpracy z pracownikami leśnictwa i dopasowanych prac terenowych w dwóch indyjskich stanach — Himachal Pradesh i Odisha — które łącznie obejmują osiem głównych typów lasu i dziewięć regionów ekologicznych. Strażnicy leśni i urzędnicy zostali przeszkoleni w obsłudze cyfrowej platformy zbierania danych na swoich telefonach: jak stanąć w określonej odległości od pnia, trzymać aparat prostopadle do kory i rejestrować dokładne pozycje. Zbieranie danych trwało od stycznia do grudnia 2024 r., obejmując pory suche, monsun i zimę. Zdjęcia robiono rano, po południu i wieczorem, w różnych warunkach świetlnych i pogodowych oraz używając 315 różnych modeli aparatów od 20 producentów. Taka zamierzona różnorodność sprawia, że zbiór odzwierciedla rzeczywiste wyzwania pracy w lesie, a nie kontrolowane warunki laboratoryjne.
Przekształcanie nieuporządkowanej rzeczywistości w rzetelny test
Rzeczywiste lasy wprowadzają wiele subtelnych uprzedzeń: być może jeden gatunek jest fotografowany głównie konkretnym telefonem, o danej porze dnia lub na określonej wysokości nad poziomem morza. Naiwny model AI mógłby „oszukiwać”, ucząc się tych skrótów zamiast prawdziwych wzorów kory. Aby uniknąć takiej pułapki, zespół zaprojektował staranny proces wyboru. Z pełnej kolekcji stworzono zrównoważony podzbiór 36 400 zdjęć, z dokładnie 2 800 fotografiami na gatunek. Zdjęcia każdego gatunku rozłożono równomiernie wśród poziomów wysokości, pór roku, stanu listowia (czy korona drzewa jest w pełnym liściu, czy goła), pór dnia i modeli aparatów. Te czynniki połączono w szczegółową siatkę i przeprowadzono próbkowanie tak, by żadna pojedyncza warunków oświetleniowych, urządzenie czy wysokość nie dominowały. Efektem jest nie tylko duży zbiór danych, ale taki przygotowany, aby zmusić systemy AI do rzeczywistego skupienia się na samej korze.

Wystawienie sztucznej inteligencji na próbę
Posiadając ten zrównoważony zbiór danych, badacze trenowali kilka popularnych modeli rozpoznawania obrazów, w tym znane sieci splotowe oraz nowoczesny model „vision transformer”. Wszystkie obrazy przeskalowano do standardowych wymiarów, a następnie podzielono na zbiory treningowe, walidacyjne i testowe. Spośród modeli najlepiej poradziła sobie sieć znana jako ResNet50, poprawnie identyfikując gatunek w około 87% obrazów testowych. Dokładniejsza analiza wykazała, że dokładność spadała w trudniejszych warunkach — zwłaszcza przy słabym wieczornym świetle i na większych wysokościach, gdzie środowiska są bardziej złożone. Wzorce te potwierdziły, że oświetlenie, pora roku i wysokość są rzeczywistymi przeszkodami dla AI, a kontrola tych czynników w zbiorze była kluczowa, by ujawnić, gdzie modele rzeczywiście zawodzą.
Co to oznacza dla lasów i przyszłych narzędzi
BarkVisionAI pokazuje, że codzienne narzędzia — smartfon i spacer po lesie — mogą zasilać zaawansowany system do szybkiej identyfikacji drzew. Dla konserwatorów przyrody i zarządców lasów otwiera to drogę do szybszego mapowania gatunków, lepszego śledzenia bioróżnorodności i terminowego monitorowania zmian środowiskowych. Dla badaczy AI zbiór stanowi wymagający punkt odniesienia, który uchwyca subtelne tekstury, zmieniające się pory roku i różnorodne urządzenia, podkreślając, że rozpoznawanie na podstawie kory daleko jeszcze od rozwiązania problemu. Główne przesłanie badania dla osób niebędących specjalistami jest jasne: poprzez staranne projektowanie zarówno danych, jak i algorytmów, możemy nauczyć maszyny czytać historie zapisane w korze drzew, pomagając lepiej rozumieć i chronić lasy.
Cytowanie: Chhatre, A., Saini, N., Parmar, A.K. et al. BarkVisionAI: Novel dataset for rapid tree species identification. Sci Data 13, 343 (2026). https://doi.org/10.1038/s41597-026-06711-8
Słowa kluczowe: identyfikacja drzew, monitorowanie lasów, bioróżnorodność, widzenie komputerowe, lasy Indii