Clear Sky Science · zh

迈向基于语音的认知障碍数字生物标志物：将语音作为认知评估的替代指标

2026-01-31 · 返回目录

日常谈话为何能反映大脑健康

我们大多数人把与朋友聊天或描述一幅图片视为理所当然。但随着年龄增长，如何选择词语、构造句子以及在短语间停顿的微妙变化，可能暗示大脑功能的状况。本研究提出了一个简单而有力的问题：是否可以通过在家用笔记本电脑录制的一段短时日常语音，作为对痴呆等问题的早期警示——而无需长时间的门诊访问和传统的笔纸测验？

倾听而非冗长测试

目前，诊断认知下降通常依赖专家的面诊测试。这些过程耗时、费用高，且难以频繁或大规模重复进行。与此同时，大批老年人面临如阿尔茨海默病等风险，而早期发现至关重要：药物与生活方式干预通常在严重症状出现前效果更好。语音是一种具有吸引力的替代信息来源。它录制成本低、可远程采集，并且自然反映多种心理能力，从记忆到注意力与计划能力。研究者着手检验短时的日常语音样本，能否作为认知健康的“数字生物标志物”。

将随意谈话转化为可测信号

研究团队招募了1003名来自美国和英国、年龄在60岁及以上的英语母语成人。参与者完成了标准的在线思维测试，测量四个广泛领域：语言、执行功能（计划与心理灵活性）、记忆与速度。他们还在家完成了三项简单的口语任务：描述两幅在临床语言测试中常用的黑白场景图片，以及谈论自己过去一周的经历。研究者使用自动语音识别软件将音频转为文本，然后从声音和词语中提取数十种可测特征——例如说话速度、停顿频率、词汇多样性，以及使用不同词类（名词、动词、代词等）的频率等。

教会计算机估算思维能力

有了这些语音特征后，研究者训练了机器学习模型去预测每位受试者的认知测验分数。他们比较了仅使用基本背景信息（年龄、性别、教育程度和国家）的模型与同时使用语音特征的模型。加入语音特征带来了显著差异：就语言能力而言，基于语音的模型解释了人群差异约27%，是仅凭人口统计信息能够解释部分的四倍多。该方法还在执行功能和思维速度方面捕捉到有意义的个体差异，尽管对记忆的解释力较弱。详细分析显示，丰富且具体的词汇使用以及更平滑、更流畅的表达（更快的语速与更少或更短的停顿）往往与更高的测试分数相关联。

识别可能出现下滑的人群

除了估算连续分数外，团队还探讨语音是否能标记那些相对于其年龄和教育背景表现异常低下的个体——这些人可能更有发展为痴呆的风险。研究者用相同的语音特征训练了另一个模型，以区分这些“认知低表现者”和其他人。特别是在语言能力方面，模型显示出良好的筛查性能，这意味着一段简单的图片描述录音可能帮助识别出一部分应接受更密切临床关注或可能是治疗试验合适人选的老年人群。

在真实患者中检验该方法

为验证模型是否捕捉到具有临床意义的差异，研究者将模型在未做再训练的情况下应用到一组独立数据集，该数据集包含阿尔茨海默病患者与几年前完成同样图片描述任务的健康对照。即便这些录音更早且噪声更多，基于语音的评分在所有四个认知领域中对阿尔茨海默组均明显更低，尤以语言与执行功能差异最大。这表明，从以大多数为健康老年人为主的大样本中学到的模式，仍然可以在确诊痴呆的患者身上发挥作用。

这对日常护理可能意味着什么

对非专业人员而言，关键结论是短时日常语音样本包含了关于老年人大脑功能状态的惊人信息量，尤其在语言与高阶思维方面。虽然该方法无法替代完整的临床评估——且单独用于记忆方面的信息价值较低——它可能成为一种低成本、非侵入性的长期监测手段，提示及时就诊，并帮助研究者筛选合适的临床试验参与者。未来，常规的电话或视频通话可能在后台静默分析我们的说话方式，早在严重问题显现之前就提供寻求帮助的提示。

引用: Heitz, J., Engler, I.M. & Langer, N. Towards a speech-based digital biomarker for cognitive impairment: speech as a proxy for cognitive assessment. npj Digit. Med. 9, 179 (2026). https://doi.org/10.1038/s41746-026-02360-8

关键词: 基于语音的认知筛查, 数字生物标志物, 阿尔茨海默病, 衰老与痴呆, 医学中的机器学习