Clear Sky Science · zh

自发性言语可实现对衰老中身体功能缺损的可扩展数字表型检测

2026-02-28 · 返回目录

为何你的声音能揭示你的行动能力

随着年龄增长，许多人会担心行动变慢——上楼梯、保持平衡或只是走到商店都会变得困难。该研究表明，一项出人意料的简单日常行为——在智能手机上说一分钟话——可能揭示我们的腿力、平衡稳定性，甚至容易疲劳的程度。通过将随意对话转化为一种“数字体检”，研究者希望使身体功能衰退的早期发现变得更简单、更普及。

倾听身体衰退的隐秘信号

研究团队对271名社区居住的老年人进行了研究，平均年龄约77岁。每位参与者完成了一项涵盖十个身体功能领域的详尽体格检查，包括腿部力量与爆发力、步速、握力、平衡、柔韧性、上下肢肌肉量、耐力、移动性和疲劳情况。在同一次访问中，参与者在平板上录制了两段一分钟的故事：一段关于积极的生活事件，一段关于消极的事件。这些简短的情感独白提供了自然、日常的语音，而不是按稿朗读的句子，使得测试既易于执行又更接近真实对话情境。

教会计算机从声音“读出”身体状况

研究者没有侧重于人们说了什么，而是研究他们如何说。借助软件，他们将每段录音分解为三类特征。声学特征捕捉诸如基频、响度以及声音中细微不规则性的特性。时序特征描绘时间维度——词和声音产生的快慢、停顿的频率与时长。语言特征反映语言使用方式：词汇丰富度、句子复杂性以及所选词类。将这些数百项测量输入机器学习模型后，模型被训练以判定每个人在各个身体领域中是表现正常还是存在缺损。

强有力的语音数字信号指示身体衰弱

计算机模型表现出相当高的准确度。在十种身体功能类型上，系统的平均曲线下面积（AUC）约为0.91，这一水平常被视为临床级别。换言之，仅凭一分钟语音，算法就能可靠地区分是否存在诸如腿部肌力减弱、平衡欠佳、步速缓慢、活动能力下降、肌肉量低或明显疲劳等问题。从积极与消极两种语音任务中结合信息的“堆叠”模型进一步提升了多数身体指标的表现，并显著减少了诸如握力和步速等重要结果的漏诊。

语音反映衰老身体的三种主要方式

当研究者利用可解释的人工智能工具打开其模型的“黑箱”时，发现最重要的线索来自声学和时序特征，而语言模式则发挥了重要但可变的作用。他们观察到三类广泛的变化。其一，许多有身体缺损的人使用更为简单的语言：描述性词汇减少、句式更基础，这暗示认知资源可能从构造复杂句子转移到维持流畅表达上。其二，神经运动-时序减慢：言语更慢或更碎片化，辅音持续时间更长，停顿更频繁或更持久，提示用于说话和运动的肌肉可能存在共同的减速现象。其三，发音-频谱衰退：声音质量不稳定、基频变化减少和共鸣模式改变，符合随年龄增长声带与呼吸肌力减弱的特征。

你声音中的潜在“衰老时钟”

有趣的是，与语音特征本身相比，诸如年龄和性别等标准因素对模型决策的贡献非常有限。这表明一个人的声音可能比生日上的烛光数量更能反映其“身体年龄”。作者提出，自发性言语可充当一种物理衰老时钟——随时间跟踪身体的力量、平衡和耐力。由于该测试仅需在常见设备上短暂录音，它最终可支持居家筛查，尤其适用于那些在偏远或资源匮乏地区难以进行全面体检的人群。尽管仍需在其他语言和人群中开展更多研究，但这项工作指向一个未来：日常对话可能同时成为一种强大且无痛的老年健康检测手段。

引用: Da Cunha, E., Zory, R., Chorin, F. et al. Spontaneous speech enables scalable digital phenotyping of physical functional deficits in aging. npj Aging 12, 52 (2026). https://doi.org/10.1038/s41514-026-00343-3

关键词: 数字生物标志物, 衰老与虚弱, 语音分析, 老年医学中的机器学习, 远程健康监测