Clear Sky Science · zh
CzechLynx:用于猞猁个体识别与姿态估计的数据集
这对野生动物保护与技术为何重要
欧亚猞猁是欧洲最神秘的大型猫科之一,在广袤的森林中以极低的密度活动。了解猞猞的数量、活动范围及其种群随时间的变化对于保护至关重要——但人工筛选数十万张相机陷阱照片既缓慢又容易出错。本文介绍了CzechLynx,这是一个大型、开放的猞猞影像集合,不仅面向生物学家,也面向构建图像分析工具的计算机科学家。通过将野生动物监测与现代人工智能相结合,该数据集旨在大幅简化对这些难觅捕食者的保护工作。

对害羞森林猫的长期观察
CzechLynx 汇集了来自两个中欧地区(西南波西米亚和西喀尔巴阡山脉)超过15年间采集的39,760张欧亚猞猁照片。这些地区地形崎岖,多为森林覆盖,猞猁以极低的密度分布,个体可横跨数百平方公里移动。保护组织和公园管理机构将相机安装在林道、动物通道和气味标记点,常采用系统化网格以确保覆盖广泛。数据集中每张图像都经过严格筛查:剔除空帧以及有人或车辆的图片,然后由专家团队根据猞猁独特的皮毛花纹确认每张照片中出现的是哪只个体。
清理、挑选与标注影像
许多相机记录的是短视频片段而非单张照片,这会产生大量几乎相同的帧。为使数据集既可管理又有信息量,作者使用自动检测器定位动物清晰出现的帧,然后从每次遭遇中最多选择三张代表性图像。这些选中的镜头偏好全身侧面视角,能清晰看见斑点花纹且动物足够接近以显露细节。人工标注者随后补充多层信息:精确的猞猁轮廓、最多20个标记关节和面部关键点的集合,以及诸如可见侧面等描述性标签。半自动工具——现代分割与姿态估计模型——用于初步生成这些标签,随后由人工进行核查和修订。
构建猞猞的数字孪生
虽然真实相机陷阱数据非常丰富,但也有局限:稀有姿态、特殊光照和某些毛色在现实中出现频率不足,无法充分训练和测试先进算法。为弥补这些空白,团队创建了真实图像的合成对照。使用Unity游戏引擎,他们将详尽的3D猞猁模型置入受真实相机陷阱地点启发的逼真虚拟森林场景中。虚拟动物沿路径移动,在随机点停留,并从不同相机角度在变化的光照和天气条件下被拍摄。为模拟多只不同个体,研究者通过文本驱动的图像合成方法生成数百种不同的毛皮纹理,产出各类自然的斑点与条纹花样。每一帧渲染图像都自动附带该猞猁的完美轮廓、骨架与身份信息。

在真实世界条件下测试计算机视觉
数据集围绕三项关键任务组织:区分个体猞猁、估计其身体姿态以及将其从背景中分离出来。一个统一且一致的元数据表将每张图像与其身份、时间与地点、视角以及特定任务的划分链接起来。为了模拟现实的保护挑战,作者定义了若干评估方案。在“地理感知”设置中,模型在一个区域训练并在另一区域测试,以考查其向新地形的迁移能力。在“时间感知”设置中,训练与测试图像按季节和年份分开,使算法必须应对动物随年龄变化、外观改变或新个体加入的情况。这些精心设计的划分有助于避免微妙的数据泄漏,并为未来方法提供严苛且现实的基准。
这对拯救猞猁意味着什么
CzechLynx 的核心是将多年艰辛的实地工作变为研究社区共享的资源。通过将专家验证的真实照片与栩栩如生的合成图像及详尽注释配对,数据集为计算机视觉系统提供了检测、追踪和识别个体猞猁所需的一切,使其能够在较长时间和远距离区域内工作。对于保护工作者而言,更可靠的自动化工具可能意味着更快速的种群规模、生存率和移动状况更新——这些对及早发现问题、精确部署保护措施以及支持这一欧洲代表性野生猫科的长期恢复都至关重要。
引用: Picek, L., Straka, J., Jirik, M. et al. CzechLynx: A Dataset for Individual Identification and Pose Estimation of the Eurasian Lynx. Sci Data 13, 511 (2026). https://doi.org/10.1038/s41597-026-06853-9
关键词: 欧亚猞猁, 相机陷阱, 野生动物监测, 计算机视觉, 合成数据