Clear Sky Science · zh

将机器学习与深度学习应用于脑部MRI以预测抑郁并识别与抑郁相关的大脑生物学

· 返回目录

为何脑部扫描与算法对情绪很重要

抑郁影响全球数以亿计的人群,但临床上仍缺乏能够客观识别高风险人群或帮助个体化治疗的检验手段。本研究提出了一个简单却迫切的问题:详尽的大脑扫描结合现代计算方法,能否提供可靠的抑郁信号?研究者通过分析来自英国生物样本库(UK Biobank)数千张脑部MRI图像,并比较传统机器学习方法与深度学习方法,探讨了大脑灰质结构中到底蕴含了多少与抑郁相关的信息。

Figure 1
Figure 1.

在数千张脑部扫描中寻找模式

团队使用了来自UK Biobank的结构性MRI扫描,关注有无重度抑郁症病史的个体。他们处理了超过1,400名抑郁患者与超过29,000名经过严格筛查的对照者,并从中划出平衡子集用于模型训练与测试。研究并没有将大脑平均划分为大区域,而是保留了灰质中由称为体素(voxel)构成的三维细网格。这一做法保留了在数据被大幅简化时可能丢失的细微、局部结构差异。所有图像都经过处理并配准到一个共同模板,以便每个体素在不同个体间可以进行有意义的比较。

比较经典模型与深度学习

研究者训练了两类预测器。一类是统计机器学习方法,称为BLUP模型,它以线性方式将数十万体素的信息组合成单一的基于大脑的风险评分。另一类是现代深度学习模型(3D ResNet),试图直接从MRI体积中学习复杂模式。在近2,500名独立测试个体中,BLUP评分显示出一种适度但可靠的能力来区分抑郁患者与对照者。抑郁者倾向于具有略高的评分,且BLUP评分每增加一个标准单位,出现重度抑郁的几率大约增加28%。相比之下,深度学习模型的表现仅略优于随机猜测,且在更严格的统计检验后未能站得住脚。

大脑评分揭示的关键区域

为了让大脑评分更具可解释性,作者按解剖区域将其分解,考察哪些区域单独考虑时对预测贡献最大。若干此前被怀疑与抑郁相关的区域——例如海马与杏仁核——在预期方向上显示出信号,连同部分丘脑、小脑以及某些额叶和颞叶区域也有表现。然而,在对大量检测区域进行多重比较校正后,这些区域特异性的效应都不足以保持显著性。一个使用不同设备扫描的小型临床样本显示出的效应方向大致一致,但样本规模不足以确凿确认任何关联。

Figure 2
Figure 2.

将大脑结构与遗传风险权衡比较

鉴于基因也影响抑郁,团队将他们的基于大脑的评分与概括多种遗传变体风险的多基因风险评分进行了比较。大脑评分与遗传评分呈温和相关,提示它们触及某些共同的生物学易感性。重要的是,将大脑评分加入到遗传评分中仅对预测准确性带来微小提升。作者还估计,在他们的样本中,灰质结构总体上仅能解释约6%的抑郁差异;即使在理想情况下,这也会将任何纯结构性大脑预测器的性能限制在相对适中的水平。

这对未来检测与治疗意味着什么

对普通读者而言,结论是:目前的结构性脑部MRI,即便结合复杂工具分析,尚无法作为可靠的独立抑郁检测手段。BLUP模型的表现在统计上可辨但远未达到临床决策所需的准确度,而深度学习并未优于更简单的方法。尽管如此,这项工作提供了关于哪些大脑区域和特征最具信息量、以及大脑结构如何与基因和塑造心理健康的生活经历相关联的有价值线索。作者认为,未来进展很可能来自结合多种类型的大脑数据、基因信息与环境因素,并聚焦于特定症状模式,而不是将抑郁视为单一的广泛类别。

引用: Jiang, JC., Brianceau, C., Delzant, E. et al. Applying machine-learning and deep-learning to predict depression from brain MRI and identify depression-related brain biology. Transl Psychiatry 16, 171 (2026). https://doi.org/10.1038/s41398-026-03889-8

关键词: 抑郁, 脑部MRI, 机器学习, 神经影像学, 遗传风险