Clear Sky Science · zh

通过多模态数据整合和元路径引导的全局-局部特征融合增强药物—疾病关联预测

· 返回目录

为什么为旧药物寻找新用途很重要

从零开始开发一种新药既缓慢又高风险,成本极高。然而,在现有的药物库中隐藏着许多可能对其他疾病也有效的药物,只要我们能发现这些额外用途。本研究提出了MedPathEx,一种基于计算的方法,筛选大量生物医学数据以预测哪些已上市药物可能对哪些疾病有效,这有望加速新疗法的发现并更好地利用现有药物。

Figure 1
Figure 1.

把多种线索汇聚到一张大图中

以往大多数将药物与疾病匹配的工具通常只依赖一种信息类型——例如两种药物分子的相似性,或两种疾病在病历中的关联程度。MedPathEx的出发点是:单一线索不足以说明问题。作者构建了一张大型“地图”,将三类实体连接起来:药物、疾病和基因。在这些连接之上,他们叠加了多种线索:药物分子的结构、治疗分类、引发的副作用、疾病在患者和医学语言中的表现,以及基因功能的已知信息。通过将这些多模态信息编织成一个异构网络,每个药物、疾病和基因都能得到比以往更丰富、更贴近真实的描述。

既看邻域又看全局

面对如此庞大的图谱,一个挑战是判断哪些模式是重要的。MedPathEx通过结合两种互补的视角来应对这一挑战。首先,它聚焦于局部邻域,追踪短而有意义的路径——例如 药物 → 基因 → 疾病——以捕捉特定基因如何将某种药物与一种疾病联系起来。这些有模式的路径称为元路径,突出了细粒度的关系。其次,方法又放大视野以考虑全局图景,让每个节点“关注”图中许多其他节点。全局注意力视角捕捉到更宽泛的趋势和长程连接,这些是单纯遵循局部路径时难以发现的。

将不同视角融合为单一信号

为了将这些网络视角转化为预测,MedPathEx使用现代神经网络技术,将复杂的图谱转成每个药物、疾病和基因的紧凑数值指纹。模型的一部分从各类型内部构建的相似性图(药物—药物、疾病—疾病、基因—基因)中学习;另一部分聚焦于局部元路径邻域;第三部分则捕捉整个网络的全局结构。模型随后学习为每一种信息源分配多少权重,并将它们融合成每个节点的综合表示。当系统比较某一药物与某一疾病的组合指纹时,会输出一个评分,反映该对在现实世界中真正相关的可能性。

Figure 2
Figure 2.

测试性能并探究关键因素

研究人员用包含数千种药物、疾病和基因之间数十万已知关联的公开数据库对MedPathEx进行测试。在严格的五折交叉验证中,MedPathEx优于多种竞争方法,包括经典的机器学习方法和若干先进的基于图的模型。诸如AUC、平均精确率和F1分数等准确性度量均更高,表明该方法在区分真实与虚假药物—疾病对方面更可靠。当逐一去除模型组件时,性能有所下降,尤其是在移除局部元路径视角或全局注意力视角时,这强调了两种视角的重要性。分析还显示,局部元路径信息贡献最大,而全局与相似性特征则提供了重要的补充。

心脏病和高血压的实际示例

除了量化指标外,作者还检查了MedPathEx对两种常见疾病——冠状动脉疾病和高血压——的高排名建议是否与医学文献一致。对于每种疾病,系统提出了若干药物,其中一些已在临床上用于相关心脏问题,这为该方法提供了可信度。另一些候选药物虽不那么显而易见,但仍具有生物学关联,例如影响炎症、血管功能或动脉斑块形成。药物、基因与疾病的网络示意图说明了这些药物可能影响与疾病相关的通路,为在实验室或临床研究中进一步探索可行的机制提供了线索。

这对未来药物意味着什么

简单来说,MedPathEx表明,通过结合多种生物医学数据源并同时观察药物、基因与疾病连接的局部与全局模式,计算方法可以更好地预测哪些药物可能对哪些疾病有帮助。尽管该工具不能替代临床试验或真实世界验证,但它可以缩小庞大的搜索空间并突显有前景的药物候选者——尤其是对于像心脏病和高血压这样的复杂疾病。随着更详细的生物学数据变得可用以及这些模型得到进一步验证,类似MedPathEx的方法有望成为药物再定位和更高效治疗策略设计的有力助手。

引用: Wu, S., Wang, W., Jiao, H. et al. Enhanced drug disease association prediction through multimodal data integration and meta path guided global local feature fusion. Sci Rep 16, 11038 (2026). https://doi.org/10.1038/s41598-026-36223-9

关键词: 药物再定位, 药物—疾病关联, 异构网络, 图神经网络, 计算药物发现