Clear Sky Science · zh

精神病患者语言连贯性降低不符合语义相似性解释并与大尺度皮层层级改变相关

· 返回目录

我们说话方式为何重要

日常对话看似轻而易举,但它依赖大脑中许多部分协同工作,以保持言语有条理并让他人理解。在像精神分裂症这样的病症中,这种言语流可能变得难以跟随,临床医生长期以来把“语言混乱”作为诊断线索。随着强大基于语言的人工智能兴起,许多人寄希望于计算机能自动衡量一个人的言语连贯性,从而让诊断和监测更具客观性。本研究提出了一个简单但关键的问题:流行的人工智能方法是否真正捕捉到人类所体验的连贯或不连贯的言语?而语言混乱又能揭示精神病患者大脑连接方式的什么信息?

Figure 1
Figure 1.

科学家如何尝试衡量“意义”

研究人员汇集了三套来自普通人群的大型书面语语料,分别为英语、中文和丹麦语,且这些文本已由人工专家评定过连贯性。他们随后使用现代语言模型将单词、句子和短文转化为数学表示,并计算了131种不同的度量。这些度量包括广泛使用的“语义相似性”分数——估算相邻单词或句子的意义接近程度——以及较新的“基于概率”的指标,衡量在前文语境下下一个词或句子的可预测性。通过将所有这些数值与人工评分比较,他们检验了哪些(如果有的话)与我们直观感受文本易于理解的判断相一致。

计算机在连贯性上的遗漏

在三种语言中,答案令人警醒。131种度量中只有6种与人工判断表现出一致但微弱的关联,而且这些并非主导当前研究的经典逐词语义相似性分数。换言之,相邻词汇在意义上的接近程度——一个常被用作连贯性的替代指标——并不能可靠地说明人们是否会觉得一段文本易于理解。表现稍好的一些度量侧重于整句之间的关系、文本中相似性模式的整体形状,以及对未来词句的可预测性。然而,即便是这些最好的相关也只是适度的,这表明连贯性是话语的一个广泛且涌现的属性,难以用任何单一数值指标完全捕捉。

沿着精神病谱系的言语变化

研究团队随后将这些有前景的计算度量运用于一组94名说英语的临床受试者:健康志愿者、处于精神病临床高风险的人、首次发病的精神病患者以及长期患病的精神分裂症患者。所有人都在描述图片时由训练有素的专家对其言语连贯性进行评定。结果出现了清晰的模式:与健康对照相比,首次发病的精神分裂症患者表现出最明显的连贯性下降,其次是慢性病患者;高风险组的下降较轻且在统计上不确定。连贯性降低与更严重的妄想、异常想法和思维混乱并存,进一步证明一个人的言语方式能够反映其潜在症状。

Figure 2
Figure 2.

可预测性与导致言语混乱的大脑连线

当研究者将最有前途的计算度量重新应用于这组临床言语时,发现词层面的不可预测性——由一个称为困惑度(perplexity)的指标捕捉——在首次发病的精神病中尤其有信息量:对语言模型而言每个词越令人惊讶,人类听者对该言语的连贯性评判越低。在慢性精神分裂症中,则呈现出另一种模式:句子意义在叙述中分布的方式与连贯性相关。部分受试者还接受了超高场磁共振成像的静息态扫描。研究团队在此处考察了大尺度的“梯度”,以总结大脑网络从基本的感觉运动区到高级、内向关注区域(例如默认模式网络)的分布范围。那些在这些系统之间显示出更清晰分离——更大分散度的个体,往往产生更连贯的言语,这表明组织化语言依赖于皮层跨层级的良好结构。

对未来工具与治疗的意义

对非专业读者而言,结论有两点。首先,精神分裂症患者的言语确实在连贯性上减少,这种变化反映了异常与思维混乱症状的严重程度,并与大尺度脑网络的排列相关。第二,把连贯性简单地视为“相邻词有多相似”的流行捷径,与人类体验并不十分吻合。更有希望的是反映语言流可预测性和句间思想组织的度量,但即便这些也只是听者感知的一部分镜像。要建立有用的临床工具,研究者需要更丰富的模型,将语法、意义与语境整合起来,并以大脑如何在功能性层级上协同语言处理为依据。

引用: He, R., Grodzki, R., Altay, N. et al. Reduced linguistic coherence in psychosis defies semantic similarity accounts and relates to altered large-scale cortical hierarchy. Sci Rep 16, 7799 (2026). https://doi.org/10.1038/s41598-026-39025-1

关键词: 精神分裂症, 言语连贯性, 语言模型, 大脑连接性, 精神病