Clear Sky Science · zh
用于检测有无失语情感者抑郁的深度学习
为什么谈论情感会如此困难
许多人与抑郁共处,但我们用于发现抑郁的主要工具仍然依赖于人们填写关于自己感受的问卷。当一个人本身就难以理解或描述自己的情绪时,会发生什么?本研究关注一组具有“失语情感”特质的人——即难以识别并用语言表达情绪——并探讨人工智能(AI)是否能帮助医生在这些情况下更准确地检测出抑郁。
自我检测为何会失效
标准的抑郁筛查量表,例如门诊或在线中患者填写的简短清单,快捷且方便。然而,它们假设人们能相对准确地察觉和报告自己的悲伤、兴趣缺失或焦虑。对于具有失语情感的人,这一假设常常失效。他们可能感到不适,却难以为自己的情绪贴标签,因此即便真正抑郁,也可能在自我检测中低估自己的痛苦。研究者发现,失语情感并不罕见——影响近十分之一的人群——且更高程度的失语情感总体上与更严重的抑郁有关。
让计算机“听”访谈内容
研究团队没有仅依赖表格,而是转向临床访谈中被说出的词语。近300名以粤语为母语的成年受试者参加了结构化访谈,包含诊断为重度抑郁障碍的患者和社区志愿者,由精神科医生使用标准抑郁评分量表进行评估。访谈内容被转写为文本。研究人员随后训练了八种大型语言模型——能够分析文本的先进AI系统——以判断每个人是否存在抑郁,参照标准为精神科医生的判断。这些模型没有看到问卷分数;它们直接从人们谈论睡眠、精力、日常生活和情绪的方式中学习。

AI对比勾选框
研究比较了AI模型与一种广泛使用的自评量表——医院焦虑抑郁量表抑郁子量表(HADS-D)——识别抑郁的能力。在所有参与者中,八个AI模型中的四个明显优于自评量表。当研究团队细分到具有失语情感的人群时,这一差异尤为显著:自评量表的准确性降至接近随意猜测的水平,而AI模型依然表现稳健,呈现出良好到优秀的性能。重要的是,无论受试者无失语情感、可能存在失语情感或明确存在失语情感,AI系统的效果都相当,这表明表达情感的困难并未干扰这些模型的判断。
当言语失效时为何AI依然稳定
为什么计算机在问卷失灵时还能成功?作者认为,访谈中的口语包含许多微妙线索——用词选择、细节程度、犹豫模式等——这些都反映了一个人的内在状态,即便他们无法为自己的情绪命名。大型语言模型被设计为在长文本中捕捉此类模式。相比之下,自评量表提供的是一组固定的简短问题,主要关注思想和感受;对于不确定如何自评的人,它们提供的空间非常有限。研究结果表明,若在严谨构建与测试下,AI工具可作为临床医生的有力辅助,尤其在专业人员有限且排队等待时间长的情境中。

这对未来护理的意义
对普通读者而言,关键信息很简单:有些人难以描述自己的感受,对于他们,标准的抑郁问卷可能会漏掉重要问题。本研究表明,分析患者在访谈中所说话语的AI系统,通常比自评表更可靠地检测出抑郁,并且在存在失语情感时仍能保持准确性。虽然AI不会取代临床医生,但它可以帮助更早地标记有风险的人并指导更个性化的护理。作者还指出,类似的方法未来或可改善其他心理健康状况的检测,使心理健康评估更贴合个体,而不是要求所有人适应同一份表格。
引用: Lam, C., Xian, L., Huang, R. et al. Deep learning for detecting depression in individuals with and without alexithymia. Commun Med 6, 123 (2026). https://doi.org/10.1038/s43856-026-01393-0
关键词: 抑郁检测, 失语情感(难以表达情感), 人工智能, 临床访谈, 心理健康筛查