Clear Sky Science · zh

由生物医学基础模型驱动的多组学特征工程改善了炎症性肠病患者的药物反应预测

· 返回目录

这项研究对患者的意义

患有炎症性肠病(IBD)的人在开始新药时常常面临令人沮丧的反复试验——对一个人有效的药物对另一个人可能几乎无效。本研究探索了如何将最初为大规模生物学理解而构建的强大人工智能(AI)模型重新用于从小规模患者数据集中提取更多信息。目标看似简单却雄心勃勃:利用每位患者的遗传和分子特征,预先预测他们对常用IBD药物的反应程度。

Figure 1
Figure 1.

用大规模AI帮助小型研究

传统的医学AI工具在患者数量较少时表现薄弱,即便每位患者都进行了深度测量。在这项工作中,研究者反其道而行之,从一个名为MAMMAL的巨大“基础模型”借用知识,该模型最初在大量蛋白质和药物数据上训练。研究者并未对该模型重新训练,而是将其作为智能计算器用来估算某药物与数千种人体蛋白的结合强度。那些结合强度得分随后成为信息量丰富的新特征,可被输入到为本研究中51名IBD患者量身定制的更小型机器学习模型中。

在肠道中窥见DNA与RNA

团队使用了来自溃疡性结肠炎或克罗恩病患者发炎肠道的组织样本。从每个样本中他们测量了两层主要生物学信息:DNA,侧重于称为单核苷酸多态性(SNPs)的微小遗传变异;以及RNA,反映每个基因在组织中的表达活性。他们还将组织暴露于泼尼松龙(一种IBD一线类固醇治疗)并测量关键炎症信号TNFα的下降幅度。TNFα的变化作为该患者组织对药物反应的替代指标。挑战在于将成千上万的遗传和分子测量值与这一药物反应结果关联起来。

教会模型关注何处

第一步是确定模型应最关注哪些蛋白和基因。利用该基础模型,研究者估算了泼尼松龙与超过1.1万种人体蛋白的结合强度,然后聚焦于预测结合最强的前5%。令人鼓舞的是,这个精简清单包含了该药物已知的靶点以及参与化学感知和信号传导的蛋白,表明AI的排序在生物学上是有意义的。随后,他们将该清单与每位患者的DNA变异结合,构建了个性化的“突变”蛋白序列并重新计算每个突变如何可能稍微增强或削弱泼尼松龙的结合。这些预测到的结合强度变化成为紧凑的、以患者为中心的特征,反映关键蛋白的变体如何改变药物作用。

Figure 2
Figure 2.

将遗传信号与基因活性结合

接着,团队加入了来自同一用于药物测试的肠组织的RNA基因活性测量。对于每个被优先考虑的蛋白,他们将其预测的结合强度与对应基因的表达活性配对,并且还将两者相乘以创建反映“相互作用状态”的特征,既体现药物预计结合的强度,也体现靶蛋白的丰度。基于这些增强特征训练的机器学习模型,在区分对泼尼松龙反应良好和反应不佳的样本方面优于使用更基础DNA表示的模型。一些最具影响力的特征指向嗅觉相关受体家族和参与抑制性脑信号GABA的一个受体,暗示这些蛋白在肠道炎症和类固醇反应中可能具有被低估的作用。

让复杂工具为非专家所用

除了生物学贡献外,研究者还解决了一个实际障碍:大多数实验室缺乏运行大型基础模型所需的计算专业知识。为此,他们将结合亲和力的工作流程封装在一个开放的模型上下文协议(MCP)服务器中,AI助手(如Claude或ChatGPT)可以直接调用。通过这种设置,科学家可以用自然语言请求预测某药物与一组蛋白的结合,系统在后台处理技术步骤。这降低了其他人使用自身数据探索类似个性化药物反应问题的门槛。

对未来治疗选择的含义

通俗来说,这项工作展示了一个在海量公开数据上训练的强大AI模型如何帮助小规模的真实患者研究发挥更大作用。通过将原始的DNA变异和基因活性转化为更丰富、具生物学意识的特征,作者提高了预测谁更可能从泼尼松龙受益的模型准确性。结果仍处于初期且基于有限数量的患者,因此他们强调的具体基因—药物联系仍需进一步验证。但总体策略——将基础模型用作智能特征生成器并通过简单接口使其可及——指向了这样一个未来:医生可借助多层分子检测并经AI解读,为每位IBD患者选择合适的药物和剂量。

引用: Gardiner, LJ., Kelly, J., Evans, A. et al. Multi-omics feature engineering driven by biomedical foundation models improves drug response prediction for inflammatory bowel disease patients. Sci Rep 16, 13820 (2026). https://doi.org/10.1038/s41598-026-44366-y

关键词: 炎症性肠病, 药物反应预测, 生物医学基础模型, 多组学, 个体化医疗