Clear Sky Science · zh
GCNPath:通过通路引导的图卷积网络审视药物反应预测
这项研究为何重要
癌症药物并非对所有人都以相同方式起作用。即便是两名肿瘤相似的患者,对同一疗法的反应也可能截然不同。本研究引入了一种名为 GCNPath 的新型计算模型,旨在更可靠地预测癌细胞对药物的反应,即便这些数据来自不同的实验室、设备或实验类型。更准确的预测可以帮助研究人员更快地筛选药物,并设计更贴合每位患者肿瘤生物学特征的治疗方案。
将细胞活动与治疗反应连接起来
每个癌细胞都有独特的基因活性与沉默模式,这决定了它对药物的反应。GCNPath 并不逐一查看成千上万的单个基因,而是将基因分组为代表关键细胞过程的生物“通路”,例如生长信号或 DNA 修复。它首先将癌细胞系的原始 RNA 测量转换为通路活性得分,采用旨在降低不同实验之间技术噪声的方法。然后将这些通路得分连接成网络,显示通路之间如何相互影响,从而捕获细胞内丰富的串扰,这些信息常被更简单的模型忽略。
从分子和通路到组合网络视图
GCNPath 将细胞和药物都视为网络。对于细胞,网络中的每个节点代表一个通路,连接表示功能性联系或相似的活动模式。对于药物,节点代表原子,连接代表化学键。该模型使用专为图结构设计的神经网络层,使其能够学习通路网络的变化如何与药物结构的变化相关联。对细胞和药物所学到的这些摘要随后被组合起来,以预测抑制细胞生长所需剂量的强度,这是药理学研究中常用的药物敏感性衡量标准。
在苛刻情形下测试模型
研究人员使用大型公共药物筛选数据集对 GCNPath 进行了系列严苛测试。在“非盲”测试中,模型预测与训练时见过的相似的细胞–药物对的反应。在更严格的测试中,模型必须应对新的细胞系、新的药物或两者同时为新的情况。在这些场景中,GCNPath 与若干领先深度学习工具相比表现相当或更好,尤其在预测从未见过的药物效应时表现突出。重要的是,其基于通路的方法帮助模型在不同的 RNA 测量平台之间保持稳定性,包括测序、微阵列,甚至蛋白质数据,而许多其他模型在这些情况下会遇到困难。
将真实世界和临床数据纳入考量
为了评估模型在受控筛选之外的泛化能力,研究团队转向了收集来自众多独立实验室结果的广泛药物数据库。即便在这种更具混杂性的环境中,GCNPath 仍表现出竞争性的准确性以及预测与观测反应之间稳健的相关性。随后,模型被应用于癌症基因组图谱(The Cancer Genome Atlas, TCGA)的患者数据,以测试其是否能区分哪些患者从某些化疗药物中受益、哪些未受益。尽管总体表现尚属温和,GCNPath 仍为若干广泛使用的药物识别出有意义的反应差异,并在结直肠癌、乳腺癌和小细胞肺癌中捕捉到了已知的癌症亚型、通路活性与药物敏感性之间的关联。
这对未来癌症治疗工具意味着什么
这项工作表明,聚焦于通路网络与基于图的学习可以使药物反应预测对新药、新样本和混合数据源更具适应性。GCNPath 并不能解决预测患者疗效的所有挑战,特别是对于远离当前化学空间的药物或复杂的多药治疗方案而言仍存在局限。然而,它提供了一个实用的框架,能够帮助研究人员在大量药物–癌症组合中筛选、突出重要的生物学信号并指导后续实验。从长远来看,此类模型有望为针对特定肿瘤的更精确、基于数据的治疗选择提供支持。
引用: Yoon, H.J., Lee, M. GCNPath: introspecting drug response prediction with pathway-guided graph convolution networks. Commun Biol 9, 720 (2026). https://doi.org/10.1038/s42003-026-09957-5
关键词: 药物反应预测, 癌症通路, 图神经网络, 精准肿瘤学, 生物信息学