Clear Sky Science · zh

使用增强灰色关联特征与多模态数据的可解释人工智能用于阿尔茨海默症早期诊断

· 返回目录

这对家庭与老龄化社会的意义

阿尔茨海默病会逐步侵蚀记忆、独立性和生活质量,但在明确诊断时,往往已有大量损害发生。本研究探讨了一种新的透明人工智能如何利用日常的医疗和生活方式信息(而非昂贵的影像检查)提前数年发现阿尔茨海默的预警信号。通过不仅指出谁具有更高风险,还揭示哪些习惯和健康因素最重要,这项工作指向了可行的、以行为为中心的策略,帮助老龄人口推迟或预防认知衰退。

日常数据中隐藏的众多微小线索

阿尔茨海默并非由单一原因引起。年龄、基因、血管健康、吸烟、运动、睡眠和早期记忆问题等都参与其中。作者汇集了一个包含2,149名受试者的真实世界数据集,每人有35项信息,涵盖人口统计学、血压、胆固醇、糖尿病、心脏病、生活习惯和简单认知测试分数。研究并非孤立地观察各项指标,而是构建了更具综合性的评分以更好地捕捉总体模式,例如好胆固醇与坏胆固醇的比值、血压比率、综合血管风险评分,以及将健忘和定向力问题混合的“认知衰退”分数。这些更丰富的信号有助于反映多个小问题如何累积成为显著风险。

Figure 1
Figure 1.

让计算机既聪明又可理解

现代人工智能能够发现远超人类直觉的微妙模式,但常被批评为“黑箱”。研究人员比较了从简单的逻辑回归到先进的基于树的方法和深度神经网络的多种方法。为避免阿尔茨海默病例少于非病例导致的偏差,他们使用了一种称为过采样的技术来为代表性不足的患者生成现实的合成样本,在训练前平衡数据集。他们表现最好的深度神经网络通过若干层虚拟“神经元”并采取防止过拟合的措施,在开发数据上约98%的情况下正确区分有无阿尔茨海默,在独立的临床测试组上约95%。

对风险驱动因素的排序

单靠高准确率在医学领域并不足够;医生还需要知道模型为何将某人标记为高风险。研究团队通过两种互补方法解决了这一点。首先,他们改编了一种称为灰色关联分析(Grey Relational Analysis)的方法,通过比较每个因素的模式与真实诊断模式的接近程度来评估相关性。通过对数据进行仔细归一化并增强评分尺度,他们加大了更具信息性与较少信息性特征之间的对比。结果显示,记忆抱怨、日常行为改变、高血压、心血管疾病和糖尿病与阿尔茨海默状态尤其密切相关,这与长期的临床经验相呼应,同时提供了更清晰的数据驱动排序。

Figure 2
Figure 2.

用可视化解释打开“黑箱”

其次,作者将SHAP(一种领先的可解释AI技术)应用于基于树的模型和深度网络。SHAP为每个因素分配一种“贡献分”,说明该因素在单个患者预测中是如何将风险向高或向低推动的。可视化摘要显示,日常活动困难、功能评估、记忆抱怨以及经年龄校正的认知测试分数是最强的信号之一。血管风险、血压比率、生活方式评分(结合运动、饮食、睡眠、吸烟和饮酒)以及家族病史也起到了重要作用。这些模式与临床医生的观察相符,增强了对模型捕捉到有意义生物学信号而非噪声的信任。作者还检查了模型在性别、族群和教育水平等方面的表现,指出了系统平衡良好与需要改进公平性的领域。

这对预防与护理可能意味着什么

简而言之,这项工作表明,经过精心设计的可解释AI系统可以利用常见的临床与生活方式数据,可靠地识别出有阿尔茨海默风险的人,同时清楚指出哪些可干预的杠杆——例如控制血压、戒烟、增加体力活动和早期认知症状——最为重要。这类工具并非取代医生,而可作为早期预警仪表板,帮助临床医生和家庭在严重记忆丧失出现前聚焦可修改的风险。随着在更大规模和更多样化人群中的进一步验证,该框架有望支持面向预防的、更个性化的护理,惠及全球数以百万计面临痴呆威胁的人群。

引用: Ullah, W., Dai, Q., Zulqarnain, R.M. et al. Explainable artificial intelligence for early Alzheimer’s diagnosis using enhanced grey relational features and multimodal data. Sci Rep 16, 13856 (2026). https://doi.org/10.1038/s41598-026-43707-1

关键词: 阿尔茨海默病, 可解释人工智能, 早期诊断, 生活方式风险因素, 机器学习