Clear Sky Science · zh
用于神经生理学和人工智能应用的多模态数据集
这对注意力困难的儿童为何重要
许多家庭、教师和临床医生都知道,很难判断孩子的躁动或走神是日常行为还是注意力缺陷多动障碍(ADHD)的表现。如今的诊断仍主要依赖访谈和问卷,容易受到记忆、期望或压力的影响。本研究介绍了BALLADEER ADHD 数据集——一个大型开放的脑与身体测量集合,采集中儿童和青少年在进行以注意力为中心的游戏时的生理数据。该数据集旨在帮助研究人员构建更客观的工具来理解和识别ADHD,并以透明、可共享的方式在全球范围内使用。 
从课堂行为到大脑与身体信号
ADHD影响大约每二十名学龄儿童中的一人,影响他们的注意力、冲动控制和活动水平。由于其症状与其他情况重叠,诊断可能很棘手。过去几十年,科学家转向脑电记录和其他身体信号以寻求更明确的生物学线索。来自头皮的电活动(EEG)可以揭示与注意力相关的模式;眼动追踪显示儿童何时、在哪儿注视重要信息;皮肤电导和心率的变化反映压力和警觉性。然而,以前的大多数研究使用的是小规模、非公开的数据集,无法被自由核查或重复利用。因此,许多有前景的发现无法被充分检验或转化为可靠的日常工具。
构建关于注意力的丰富共享图景
BALLADEER 项目的目标是通过收集多模态数据来改变这一现状——即同时来自多种来源的协调测量。团队记录了164名6至18岁儿童和青少年的数据,其中62名被诊断为ADHD,102名未被诊断。在为期两天的多个环节中,参与者完成了一系列知名的纸笔测试以及模仿日常注意力挑战的计算机和虚拟现实任务。参与者在玩游戏和解决问题时,研究人员使用EEG 头戴设备记录脑电活动,使用置于显示器下方的眼动追踪条记录眼动,并用腕带设备记录心率和皮肤电导等信号。所有这些都与逐秒记录的屏幕事件日志配对。
更像游戏而非测试的注意力任务
为了使数据采集富有吸引力并适合儿童,团队设计了类似游戏的任务。在“注意力走钢丝”中,儿童观察两座山上的旗帜,当模式匹配时按下按钮;他们的脑电、注视和心率信号被持续记录。在“注意力机器人”中,他们扫描成排的卡通机器人,仅选择具有特定特征的机器人,系统精确记录他们正在看的机器人。一个名为 CogniFit 的商业平台提供多种短时练习以探查感知、协调与问题解决能力,虚拟现实系统 Nesplora 则将儿童置于模拟教室或水族馆中,以测量他们在逼真干扰下遵循指令的能力。总体而言,这些任务旨在考察持续注意力、冲动控制和心理灵活性——这些正是ADHD人群常见的挑战。 
数据如何被采集与组织
在幕后,研究人员构建了专用的软件和硬件配置,以确保所有设备同步运行。一个基于Python的中央服务器在游戏关卡开始与结束的同一时刻启动和停止EEG头戴设备与腕带的记录。游戏在儿童做出反应或屏幕上出现关键事件时发送带时间戳的消息。所有原始信号和事件日志以简单且广泛使用的格式(CSV 和 JSON)存储在受保护的网络驱动器上。共享结构包括按匿名用户ID、任务、日期和设备类型标注的文件夹,以及描述每位参与者年龄、性别和ADHD状态但不泄露个人身份的文件。作者有意避免进行大量预处理,以便其他科学家可以应用自己的清洗方法和分析技术。
优点、局限与后续方向
BALLADEER 数据集的突出之处在于它在相对较大的青少年群体中同时结合了多种同步测量,并且完全开放供他人下载和分析。这使其成为测试新人工智能方法的宝贵试验场,用以发现与ADHD相关的模式或发现可补充临床判断的新型数字“生物标志物”。同时,作者也清楚其局限:样本来自单一地区,ADHD 亚型未被系统性标注,规模对于训练非常大的深度学习模型仍显有限。一些记录包含与运动相关的噪声,且没有单独的静息态条件。团队并未掩盖这些问题,而是加以记录,便于使用者设计慎重的分析。
这对家庭与未来护理的意义
在日常语境中,该数据集本身并不对任何儿童作出诊断。相反,它为研究人员提供了一个强大的共享显微镜,用以研究注意力困难如何在现实任务中通过大脑、眼睛和身体表现出来。随着时间推移,基于 BALLADEER 的工作可能帮助临床医生超越清单和直觉,通过引入基于数据的客观测量来丰富工具箱。这可能带来更早、更准确的ADHD识别,更好地追踪儿童对治疗的反应,以及在学校和临床中更公正的决策。通过将类似游戏的活动转化为精确测量并公开分享这些数据,该研究为面向注意力困难儿童的新一代基于科学的支持奠定了基础。
引用: Trujillo, J., Ferrer-Cascales, R., Teruel, M.A. et al. A Multimodal Dataset for Neurophysiological and AI Applications. Sci Data 13, 436 (2026). https://doi.org/10.1038/s41597-026-06758-7
关键词: 多动症(ADHD), 脑电图(EEG), 眼动追踪, 生理信号, 机器学习