Clear Sky Science · zh
PanMETAI——一种用于通过核磁共振代谢组学准确诊断胰腺癌的高性能表格基础模型
为何早期发现这种癌症至关重要
胰腺癌是致死率极高的癌症之一,主要因为通常在疾病晚期才被发现,此时手术和其他治疗手段成功的机会很小。现有的血液检测常常漏检许多早期病例或产生误报。本研究介绍了一种新的非侵入性血液检测方法,称为 PanMETAI,它结合了先进的化学检测与人工智能,仅用少量血样即可更早、更准确地发现胰腺癌。
将血液化学转化为癌症指纹
研究者聚焦于胰腺导管腺癌(PDAC),这是胰腺癌中最常见且致死率最高的类型。他们没有仅观察一两个传统标志物(例如广泛使用的 CA19-9),而是对血液进行了全景式分析。通过高分辨率质子核磁共振(1H NMR)谱,他们记录了血清中数千个来自小分子和血脂的信号。这些看不见的化学模式,连同年龄、CA19-9 和一种名为 Activin A 的蛋白,构成了一个代谢“指纹”,能够将患有 PDAC 的人群与高风险但无癌的个体区分开来。 
教会智能模型解读这些信号
为了解释这海量数据,团队比较了多种机器学习方法,包括支持向量机、一套名为 AutoGluon 的自动化模型套件,以及一种基于 Transformer 的新系统 TabPFN。他们在台湾 350 名受试者的血样上训练和调优模型,并谨慎地将数据划分为训练集、开发集和盲测集,以模拟真实世界的诊断场景。虽然所有方法均表现良好,但 TabPFN 脱颖而出。最终基于 TabPFN 的模型命名为 PanMETAI,整合了经筛选的 NMR 信号、年龄、CA19-9 和 Activin A,形成单一判定,能在台湾队列中近乎完美地区分癌症与非癌症样本。
跨不同分期与国家的高准确度
在台湾盲测集上,PanMETAI 获得了 0.99 的曲线下面积(AUC),显示出极高的诊断准确性。重要的是,它不仅对晚期癌症有效,对早期(I/II 期)疾病的检测同样表现良好,而早期检测的价值尤为显著。该模型随后在一个由 322 名立陶宛受试者组成的独立队列上进行了验证——该人群在生活方式和医疗体系上与台湾存在差异。在立陶宛样本中,AUC 仍达 0.93,灵敏度和特异性都很理想,并且在仅考虑早期患者时仍保持良好性能。该系统在样本量相对较少的情况下仍能取得令人惊讶的效果,表明即使是无法获得非常大数据集的医院也有望采用该方法。 
血液化学揭示的疾病信息
除了单纯的准确率外,科学家们还探究了血液指纹中哪些成分最为关键。通过检查模型依赖的 NMR 峰并应用一种名为 SHAP 的解释工具,他们强调了在癌症中发生变化的特定代谢物和脂蛋白。早期患者表现出“有益”高密度脂蛋白(HDL)和氨基酸谷氨酰胺水平偏低,同时葡萄糖、乳酸、谷氨酸、鸟氨酸和 TMAO 化合物水平升高。这些改变对应于癌细胞用于生长和存活的能量及氨基酸通路。网络与通路分析证实了糖类利用、脂类处理和氨基酸代谢的改变与胰腺癌生物学紧密相关,为人工智能模型的判断提供了生物学可信度。
朝实用早筛迈出的一步
对非专业读者来说,关键的信息是:PanMETAI 能把一次常规抽血变成丰富的化学快照,并利用强大的 AI 模型将该快照解读为胰腺癌的条形码。它的表现优于现有血液检测,跨国适用,并且可以用适度数量的病人数据进行训练。尽管在广泛应用之前仍需更大规模的前瞻性研究,但这种方法指向了未来早筛工具的发展方向,有望在可挽救生命的时机更早发现胰腺癌。
引用: Wu, DN., Jen, J., Fajiculay, E. et al. PanMETAI - a high performance tabular foundation model for accurate pancreatic cancer diagnosis via NMR metabolomics. Nat Commun 17, 1595 (2026). https://doi.org/10.1038/s41467-026-69426-9
关键词: 胰腺癌, 早期检测, 代谢组学, 人工智能, 血液检测