Clear Sky Science · zh
关于抑郁和焦虑症状管理中聊天机器人系统评价与荟萃分析
为什么情绪对话机器很重要
抑郁和焦虑等心理健康问题影响全球数亿人,但由于费用、距离或污名化等原因,许多人从未获得治疗。近年来,心理健康聊天机器人出现在应用和网站中,承诺提供全天候、低成本的支持。本文提出了一个对任何关心这些数字帮手的人都很实用的问题:心理健康聊天机器人真的能帮助人们感觉不那么抑郁或焦虑吗?它们对哪些人最有用?

研究者想弄清的是什么
作者们进行了系统评价与荟萃分析,也就是他们检索了科学文献,挑选出最严谨的随机对照试验并合并结果。他们聚焦于两个与使用者直接相关的明确结局:使用标准问卷测量的抑郁症状和焦虑症状的变化。为保持比较公平,他们只纳入以聊天机器人为干预核心并与某种对照组(如常规护理、仅信息材料或等待名单)进行对照的研究。
研究如何被筛选和合并
研究团队利用五个主要医学和心理学数据库,检索了2017年至2025年底发表的试验,这一时期现代人工智能和大型语言模型开始影响聊天机器人设计。在超过14,000条记录中,有39项研究满足严格的纳入标准。合计这些试验在抑郁结局方面涉及超过7,400人,在焦虑结局方面超过7,600人,涵盖美国、中国、日本等多个国家。部分参与者有确诊的心理健康问题,有些存在轻中度症状,另一些则来自一般人群并无明显临床问题。聊天机器人的类型也各不相同,从基于规则、选择预写回应的系统到能够即时生成回复的更新型生成模型都有。
结果对益处的说明
将所有试验的数据合并后,使用心理健康聊天机器人的人相比对照组在抑郁和焦虑症状上都出现了小但统计学上可靠的下降。用通俗的话说,聊天机器人不会消除情绪困扰,但平均而言会把使用者稍微向更好的方向推一把。益处并非对所有人都相同:抑郁症状的改善在已经有临床抑郁或明显困扰的人群中明显更大,而在起始时症状很少或没有症状的人中则较小。焦虑方面总体模式相似,但不同群体间差异的证据不如抑郁那么明确。重要的是,在这些试验中,聊天机器人的类型——无论是较旧的检索式系统还是较新的生成式系统——尚未显示出明确的优劣之分。

空白、安全问题与未解之问
尽管信号令人鼓舞,综述揭示了重要的警示。大多数试验依赖参与者自评症状,这可能夸大感知到的变化。许多研究被评为有较高偏倚风险,因为参与者可能知道自己是否在与机器人对话,这会影响他们填写问卷的方式。试验在设计、时长和对照组类型上差异很大,使得得出非常精确的结论更困难。安全监测通常很少或报告不充分;只有少数研究描述了应对危机(如自杀想法)或纠正有害机器人回复的明确程序。
这对考虑使用聊天机器人的人的意义
总体而言,证据表明心理健康聊天机器人可以提供适度的帮助,特别是对那些已经在与抑郁或焦虑斗争、可能在等待或作为传统护理的补充的人群。对情绪本已良好的人来说,它们作为通用健康工具的用处则较小。作者认为未来系统应更多根据个体症状水平进行个性化、使用更好的结局测量,并更重视安全与长期随访。对公众而言,结论是:聊天机器人不是治疗或替代专业护理的手段,但在像其他健康工具一样以同等严谨的方式设计、测试和监管时,它们可以发挥支持性作用。
引用: Sohn, JS., Ha, BG., Park, S. et al. Systematic review and meta analysis of chatbots in the management of depressive and anxiety symptoms. npj Digit. Med. 9, 377 (2026). https://doi.org/10.1038/s41746-026-02566-w
关键词: 心理健康聊天机器人, 抑郁支持, 焦虑管理, 数字疗法, 大型语言模型