Clear Sky Science · zh
用于平滑追踪分类的眼动基准数据
为什么跟踪眼动重要
每当你阅读一句话、观看一场足球赛或在黑暗中追随一只萤火虫时,你的眼睛都会进行一场由快速跳跃与平滑滑动组成的复杂舞蹈。这些细微运动揭示了我们的注意力所在与大脑如何工作,并且越来越多地用于研究脑外伤与痴呆等病症。但用于分析眼动数据的计算机仍然难以区分两类关键眼动:注视静止物体与平滑跟随移动目标。本文介绍了一个精心设计的数据集,旨在帮助研究者训练和测试更好的算法以区分这些眼动类型。
解读眼动的挑战
眼动仪每秒记录我们视线指向的位置数千次,但将这些数值流转换为有意义的事件并不容易。存在快速跳跃(扫视)、在某一点稳定注视(注视)以及对移动物体的平滑跟随(平滑追踪)。在原始数据中,注视和平滑追踪看起来出奇地相似,因为两者在某些时刻眼球都缓慢移动。专家之间常常对二者的划分意见不一,许多计算算法也会混淆它们。这尤其成问题,因为平滑追踪的表现是诊断和理解精神分裂、创伤性脑损伤以及神经退行性疾病等病症的重要线索。
设计干净、受控的眼动
为了解决这个问题,作者们构建了一个高度受控的实验,而不是依赖嘈杂的真实场景。十名大学生头部固定在下颚托上,注视屏幕,屏幕上在黑色背景中以不同方式移动着一个小灰色圆点。研究人员为该圆点设计了三种简单的“行为”:匀速滑动的移动圆点、在固定位置间跳动的跳跃圆点,以及来回滑动然后跳回起点的往返圆点。每次试验被设计成在慢速运动方面只可能出现一种类型(要么是注视要么是平滑追踪),同时会伴有快速跳跃。这个巧妙的设置意味着长时间的缓慢区间几乎可以确定是纯粹的注视或纯粹的跟随,而不会两者混杂。

精确测量与高质量数据
研究团队使用了一台高速眼动仪,以每秒1000次的频率记录右眼位置,屏幕刷新率为每秒144次。目标按八个直线方向移动(上、下、左、右及四个对角线方向),并以代表慢、中、快的三种速度呈现。每位参与者完成144个短试验,合计每人大约24分钟数据,总计近四小时。研究者反复校准眼动仪,检查记录的视线与目标的匹配度,并监控因眨眼或跟踪丢失导致的数据缺失情况。除了一名参与者中明确指出的一组未对齐试验外,这些检查显示眼睛位置与目标位置对齐良好,注视稳定且精确。
从原始轨迹到有用标签
作者没有让人类对每一时刻的数据进行逐帧标注,而是利用实验结构来指导自动标注。首先,他们清理原始文件、移除眨眼段,并将屏幕上的坐标转换为更能反映眼球运动的视角单位。然后,对每个试验计算眼位随时间的变化速率,并构建定制的速度阈值。低于该阈值的运动被视为“慢”事件(视试验类型而定为注视或追踪),而更快的突发则被视为跳跃。对极短的事件(短于约百分之一秒)进行了重标注,以避免将微小故障计为有意义的眼动。这产生了作者所称的“合理的基准标签”,用于注视、扫视和平滑追踪,既基于实验设计也基于测量到的眼速。

为研究社区提供的工具
为了让数据集广泛可用,作者将所有文件放在开放的线上平台,并发布了配套的Python软件包。研究人员可以下载原始记录、清理后的版本、每位参与者的信息以及精确的目标路径。配套包包含现成的函数用于下载、预处理和标注数据,以及用于可视化试验的绘图工具。由于实验代码也已公开,其他实验室可以重现相同任务并扩展数据集,或探索将目标位置信息纳入算法的新方法。
对未来眼动追踪的意义
对非专业读者而言,核心信息是这项工作提供了一个干净的测试场,便于教计算机识别不同类型的眼动,尤其是平滑追踪这一微妙动作。通过避免在同一试验中让最易混淆的运动重叠,并依靠明确的速度差异而非易出错的人为判断,作者提供了一个坚实的参考集,供他人基于此继续改进。随着时间推移,在此类数据上训练出的更好算法,有望让眼动追踪在心理学、神经科学和医学诊断中成为更可靠的工具,帮助临床医生与研究者更清晰地看到眼动如何反映大脑的工作机理。
引用: Korthals, L., Visser, I. & Kucharský, Š. Eye movement benchmark data for smooth-pursuit classification. Sci Data 13, 375 (2026). https://doi.org/10.1038/s41597-026-06963-4
关键词: 眼动追踪, 平滑追踪, 扫视, 基准数据集, 凝视分类