Clear Sky Science · zh

BarkVisionAI：用于快速树种识别的新数据集

2026-02-03 · 返回目录

为什么树皮和手机相机很重要

当我们漫步于森林时，通常会注意到叶子、花朵或高耸的树冠。但在大部分时间——或在浓密阴暗的林地中——这些线索往往缺失。该研究表明，树木粗糙、有纹理的皮层——即树皮——结合日常智能手机相机和现代人工智能，可以成为快速识别树种并跟踪印度乃至可能全球森林健康状况的强大工具。

观察森林的新方式

BarkVisionAI 背后的研究团队着手填补树木识别中的一项重要空白。现有的大多数树木识别图像集侧重于叶片或其他可见部位，而少数关于树皮的图像数据集往往规模小、地域有限且拍摄条件几乎相同。这使得在这些数据上训练的计算机模型难以在复杂的真实森林环境中应用。BarkVisionAI 改变了这一点：它汇集了来自印度多样林型和生态区的 13 种重要树种的 156,001 张树皮照片。每张图片不仅仅是图像：它还关联了精确的位置、时间和相机信息，为生态学和人工智能提供了丰富的资源。

图像如何采集

采集如此大量且有用的照片需要与林业人员的密切合作并在印度两个邦——喜马偕尔邦和奥里萨邦——开展定制化的野外工作，这两个地区涵盖了八种主要林型和九个生态区。林业护林员和官员接受了在手机上使用数字数据采集平台的培训，学习如何与树干保持一定距离、将相机垂直对准树皮并记录准确位置。数据采集从 2024 年 1 月持续到 12 月，跨越干季、季风季和冬季。图像在早晨、下午和傍晚拍摄，处于不同光照和天气条件下，并使用来自 20 家制造商的 315 款不同相机型号。这样的刻意多样性确保数据集反映真实世界中在森林工作时遇到的挑战，而非实验室的受控条件。

将凌乱的现实转化为公平的测试

真实的森林环境引入了许多微妙的偏差：也许某个物种大多用特定手机拍摄、在某个时段或某一海拔层上被记录。粗糙的 AI 模型可能会通过学习这些捷径“作弊”，而不是识别真正的树皮纹理。为避免这一陷阱，团队设计了一个谨慎的筛选过程。从全部采集的图像中，他们构建了一个平衡子集，共 36,400 张图像，每种树都正好有 2,800 张照片。每个物种的图像在海拔、季节、叶片状态（树冠是否有叶或光秃）、时段和相机型号上均有分布。这些因素被组合成细粒度的网格，并按此采样，确保没有单一光照条件、设备或海拔占主导。其结果不仅是一个大型数据集，还是一个旨在促使 AI 系统关注树皮本身的精心构建资源。

将人工智能付诸考验

利用这个平衡后的数据集，研究人员训练了若干流行的图像识别模型，包括广为人知的卷积神经网络和一种现代的“视觉变换器”模型。所有图像都被调整为标准尺寸，然后拆分为训练、验证和测试集。在这些模型中，一种名为 ResNet50 的网络表现最佳，在测试图像上约有 87% 的识别准确率。更细致的分析表明，在更困难的条件下——尤其是傍晚光线较弱时和海拔较高、环境更复杂的地区——准确率仍会下降。这些模式证实了光照、季节和海拔确实是 AI 面临的真实障碍，并且在数据集中控制这些因素对于揭示模型真实薄弱之处至关重要。

这对森林和未来工具意味着什么

BarkVisionAI 展示了日常工具——一部智能手机和一次林间步行——可以为快速树种识别提供数据，进而支撑复杂系统。对于保护工作者和森林管理者而言，这为更快速的物种绘制、更好的生物多样性追踪以及更及时的环境变化监测打开了大门。对于人工智能研究者来说，该数据集提供了一个苛刻的基准，涵盖细腻的纹理、季节变化和多样化设备，表明基于树皮的识别距离被彻底解决仍有距离。对于非专业读者，研究的主要信息很清晰：通过对数据和算法的精心设计，我们可以教会机器阅读树皮上写下的故事，帮助我们更有效地理解和保护森林。

引用: Chhatre, A., Saini, N., Parmar, A.K. et al. BarkVisionAI: Novel dataset for rapid tree species identification. Sci Data 13, 343 (2026). https://doi.org/10.1038/s41597-026-06711-8

关键词: 树木识别, 森林监测, 生物多样性, 计算机视觉, 印度森林