Clear Sky Science · zh
一个基于深度学习的开源工具箱用于自动化听觉脑干反应(ABRA)分析
为什么更好的听力测试至关重要
随着人们寿命延长,听力损失正成为全球最常见的健康问题之一。它不仅让交流变得困难,还与后期记忆问题和痴呆相关。为了理解和治疗听力损失,科学家依赖一种从耳朵和脑干记录的特殊电信号,称为听觉脑干反应(ABR)。这些记录非常有用,但传统上需要专家目视检查波形,这一过程既耗时又具有主观性。本文介绍了 ABRA——一个免费的自动化软件工具箱,利用现代人工智能快速且一致地读取这些信号。

从耳内的点击到屏幕上的波形
当短促的声音进入耳朵时,内耳的微小感受细胞及其后续的神经纤维会产生快速的放电。这些活动沿脑干上传,可被放置在头部的电极检测到。产生的就是 ABR 波形:在声音发生后的最初几毫秒内出现的一系列小波。在小鼠中,第一个较大的波反映听觉神经的活动,尤其对耳蜗早期损伤敏感,包括神经纤维与毛细胞之间连接(突触)的丧失。研究人员通过读取这些波来估计能听到声音所需的响度(阈值)以及神经反应的强度和速度。这些测量中的微小变化可以在标准听力测试出现异常之前揭示潜在损伤。
人工读取的问题
尽管 ABR 测试是客观记录,但分析方式往往不是。不同实验室使用不同软件,即使是经验丰富的评审者在判断波形何时开始、何时达到峰值和何时结束时也可能存在分歧,尤其是在信号微弱或有噪声时。手动标注大型实验中的成千上万条波形需要数小时,且难以在研究之间进行比较。一些团队尝试了基于规则的计算方法或传统机器学习技术,但这些方法灵活性有限,可能难以应对现代研究中多样的记录设置、小鼠品系和不同类型的听力损伤。
一个新的自动化工具箱
ABRA(听觉脑干反应分析器)通过将深度学习模型与用户友好的界面相结合来应对这些挑战。作者在来自三个独立听力研究实验室的两万多条 ABR 记录上训练了卷积神经网络——这是一类擅长识别复杂模式的人工智能。尽管设备、声音设置和小鼠模型存在差异——包括衰老更快或暴露于强噪声的动物——相同的模型学会了检测波形的关键特征,并区分真正反映听觉的反应与仅为背景噪声的信号。ABRA 包含两个主要工具:一个用于精确定位第一道 ABR 波的时间和幅度,另一个用于在一系列声级中判定哪个声级代表真实的听觉阈值。

与专家同样准确,速度提高数十倍
为评估 ABRA 的性能,团队将其自动测量结果与数千条人工标注进行了比较。对于 ABR 的第一道波,ABRA 在时间和幅度的估计上几乎总是与专家标注相差极小——时间差仅为毫秒的极小部分、幅度差为微伏的极小部分,最大的误差仅在信号本身几乎不可见时出现。在阈值检测中,测试了多种机器学习模型,深度学习方法在所有准确性指标上均优于更简单的方法。面对面的比较显示,ABRA 与专家人工评估的一致性与两位专家之间的一致性相当,并匹配或优于另一常用 ABR 软件包中采用的交叉相关方法。最重要的是,分析 90 组小鼠数据人工需要大约一小时,而使用 ABRA 则不到一分钟,速度提升约 75 倍。
这对听力研究意味着什么
ABRA 将听力实验中曾经缓慢且主观的步骤转变为快速、标准化且易于共享的流程。由于它是开源的、可在网上免费获得,并且能够读取多种常见文件格式,因此可以无需特殊编程技能就集成到许多现有工作流程中。目前模型是在小鼠数据上训练并对第一道 ABR 波有最佳验证,因此非常异常的案例或其他物种可能仍需专家复核或未来的再训练。尽管如此,这个工具箱展示了人工智能如何解读复杂的生物信号,帮助科学家研究听力如何随着年龄、噪声或疾病而衰退——并最终支持保护听力与大脑健康的努力。
引用: Erra, A., Miller, C.M., Chen, J. et al. An open-source deep learning-based toolbox for automated auditory brainstem response analyses (ABRA). Sci Rep 16, 9855 (2026). https://doi.org/10.1038/s41598-026-38045-1
关键词: 听力损失, 听觉脑干反应, 深度学习, 自动信号分析, 小鼠神经科学