Clear Sky Science · pt
BarkVisionAI: Novo conjunto de dados para identificação rápida de espécies de árvores
Por que a casca das árvores e câmeras de celular importam
Quando caminhamos pela floresta, normalmente notamos folhas, flores ou copas imponentes. Mas durante grande parte do ano — ou em bosques densos e sombreados — essas pistas desaparecem. Este estudo mostra que a superfície rugosa e padronizada das árvores — sua casca — combinada com câmeras de smartphones comuns e inteligência artificial moderna, pode se tornar uma ferramenta poderosa para identificar rapidamente espécies de árvores e monitorar a saúde das florestas na Índia e, potencialmente, no mundo.

Uma nova maneira de ver as florestas
Os pesquisadores por trás do BarkVisionAI partiram para preencher uma lacuna importante em como reconhecemos árvores. A maioria das coleções de fotos existentes para identificação foca em folhas ou outras partes visíveis, e os poucos conjuntos de imagens de casca tendem a ser pequenos, de regiões limitadas e fotografados em condições quase idênticas. Isso dificulta o desempenho de modelos treinados nesses dados em florestas reais e desordenadas. O BarkVisionAI muda isso ao reunir 156.001 fotos de casca de 13 espécies de árvores importantes, cobrindo diversos tipos de florestas e regiões ecológicas na Índia. Cada imagem é mais do que uma fotografia: está vinculada a informações precisas de localização, horário e câmera, criando um recurso valioso tanto para a ecologia quanto para a inteligência artificial.
Como as imagens foram coletadas
Coletar tantas fotos úteis exigiu colaboração próxima com funcionários florestais e trabalho de campo adaptado em dois estados indianos, Himachal Pradesh e Odisha, que juntos abrangem oito grandes tipos de florestas e nove regiões ecológicas. Guardas e oficiais florestais foram treinados para usar uma plataforma digital de coleta de dados em seus celulares, aprendendo a manter uma distância fixa do tronco, segurar a câmera perpendicular à casca e registrar localizações precisas. A coleta de dados ocorreu de janeiro a dezembro de 2024, abrangendo estações secas, monções e inverno. As imagens foram feitas pela manhã, tarde e noite, sob diferentes condições de luz e clima, e usando 315 modelos de câmeras distintos de 20 fabricantes. Essa variação deliberada garante que o conjunto de dados reflita os desafios reais de trabalhar em florestas, em vez das condições controladas de um laboratório.
Transformando a realidade desordenada em um teste justo
Florestas reais introduzem muitos vieses sutis: talvez uma espécie seja fotografada principalmente com um telefone específico, em determinado horário do dia ou em uma única altitude. Um modelo de IA ingênuo poderia “trapacear” aprendendo esses atalhos em vez dos verdadeiros padrões da casca. Para evitar essa armadilha, a equipe desenhou um processo de seleção cuidadoso. A partir da coleção total, eles construíram um subconjunto balanceado de 36.400 imagens, com exatamente 2.800 fotos por espécie. As imagens de cada espécie foram distribuídas por níveis de elevação, estações, condições de folhagem (se a copa estava com folhas ou sem), horários do dia e modelos de câmera. Esses fatores foram combinados em uma grade detalhada, e as imagens foram amostradas de modo que nenhuma condição de iluminação, dispositivo ou altitude dominasse. O resultado não é apenas um grande conjunto de dados, mas um criado para obrigar os sistemas de IA a prestar atenção à própria casca.

Submetendo a inteligência artificial ao teste
Com esse conjunto balanceado em mãos, os pesquisadores treinaram vários modelos populares de reconhecimento de imagens, incluindo redes neurais convolucionais conhecidas e um modelo moderno de “transformer” para visão. Todas as imagens foram redimensionadas para dimensões padrão e então divididas em conjuntos de treinamento, validação e teste. Entre os modelos, uma rede conhecida como ResNet50 teve o melhor desempenho, identificando corretamente as espécies em cerca de 87% das imagens de teste. Uma análise mais detalhada mostrou que a precisão ainda caía em condições mais difíceis — especialmente em luz baixa do entardecer e em altitudes maiores, onde os ambientes são mais complexos. Esses padrões confirmaram que iluminação, estação e altitude são obstáculos reais para a IA, e que controlar esses fatores no conjunto de dados foi essencial para revelar onde os modelos realmente têm dificuldades.
O que isso significa para florestas e ferramentas futuras
O BarkVisionAI demonstra que ferramentas do dia a dia — um smartphone e uma caminhada pela mata — podem alimentar um sistema sofisticado para identificação rápida de árvores. Para conservacionistas e gestores florestais, isso abre portas para mapeamentos de espécies mais rápidos, melhor monitoramento da biodiversidade e acompanhamento mais ágil de mudanças ambientais. Para pesquisadores em IA, o conjunto representa um referencial exigente que captura texturas sutis, estações que mudam e dispositivos diversos, destacando que o reconhecimento baseado em casca está longe de ser um problema resolvido. A mensagem principal do estudo para não especialistas é clara: ao projetar cuidadosamente dados e algoritmos, podemos ensinar máquinas a ler as histórias escritas na casca das árvores, ajudando-nos a entender e proteger as florestas com mais eficiência.
Citação: Chhatre, A., Saini, N., Parmar, A.K. et al. BarkVisionAI: Novel dataset for rapid tree species identification. Sci Data 13, 343 (2026). https://doi.org/10.1038/s41597-026-06711-8
Palavras-chave: identificação de árvores, monitoramento florestal, biodiversidade, visão computacional, florestas da Índia