Clear Sky Science · zh
一种基于机器学习的药代动力学预测器(EGFR-PROPK)用于靶向EGFR的PROTACs
为难治性癌症提供更智能的药物设计
许多有前景的新抗癌药物失败并非因为未能命中靶点,而是因为体内清除得太快、在错误的部位积累或吸收不良。一类被称为PROTACs的新药可以摧毁曾被认为“不可成药”的致病蛋白,但它们在体内的行为尤其难以预测。本研究提出了一种专为这一类靶向关键癌症蛋白的PROTACs设计的机器学习工具EGFR-PROPK,旨在预测这些分子在体内的药代动力学表现,帮助科学家更早选择更有前途的候选药物,减少在无效方向上浪费的时间和资源。

新型蛋白降解药物及其挑战
PROTACs 是一种不同寻常的药物:它们不是简单地阻断蛋白,而是标记该蛋白以被细胞自身的降解机制清除。每个 PROTAC 将对疾病靶点的结合片段与招募细胞“降解者”的片段通过一段柔性链连接起来。这一设计使其能够针对传统药物难以接触的蛋白,并且往往允许暂时结合而非持续占据蛋白位点。然而,这种较大的体积和复杂性也使得 PROTACs 在体内的递送和控制更加困难。它们往往体积较大、相对疏水并强烈结合血浆蛋白,这些特性都会使其吸收、分布、代谢和清除过程变得复杂。
常规药物行为规则为何不适用
传统药物开发者使用分子量、亲脂性(LogP)以及“类药性”等经验指标来推测化合物在体内的表现。研究人员首先问:这些熟悉的指标能否解释 100 个靶向表皮生长因子受体(EGFR,一种多种癌症的主要驱动因子)的 PROTACs 在活体小鼠中的表现。他们关注三个关键属性:清除率(体内清除药物的速度)、半衰期(药物在循环中停留的时间)和表观分布容积(分布到组织的广度)。当他们将这些属性与基本描述符进行比较时,数据点几乎没有明显趋势地分散,表明简单的化学规则不足以预测 PROTACs 的体内行为。
训练一个量身定制的预测引擎
为弥补这一空白,团队构建了 EGFR-PROPK——一个专门针对靶向 EGFR 的 PROTACs 的机器学习预测器。他们首先对 100 种不同的 PROTACs 在小鼠中进行了研究,测量给药后的清除率、半衰期和分布容积。随后,他们使用多种丰富的“指纹”来描述每个分子的详细结构,并计算了 200 个额外的化学特征。这些数值描述被输入到基于 CatBoost 的模型中,这是一种擅长在表格数据中发现模式的现代算法。与通用工具不同,EGFR-PROPK 是直接在 PROTACs 的体内数据上训练的,使其能够学习复杂的连接体形状、整体尺寸与药物在血液中停留时间或向组织分布之间的细微关系。
优于通用模型并揭示隐含细节
研究人员将 EGFR-PROPK 与主要为传统小分子药物构建的广泛使用的预测平台进行了比较。当将这些通用模型“照搬”用于 PROTACs 时,它们的预测效果很差:对半衰期、清除率和组织分布的估计常常与实际测量值大相径庭。即便将其中一个竞争模型用 PROTAC 数据进行微调,它仍然落后于 EGFR-PROPK。相比之下,EGFR-PROPK 在预测值与实验值的一致性上表现显著更好,尤其是在半衰期和清除率方面,分布预测也有中等改进。该模型还能处理真实案例研究:两种结构非常相似但行为差异很大的 PROTACs,被 EGFR-PROPK 比通用工具更准确地区分,强调了使用 PROTAC 专用训练数据的重要性。

绘制化学景观及其局限
除了性能指标外,团队还检查了他们的 100 个 PROTACs 是否覆盖了广泛的设计类型,还是仅处于化学空间的狭窄角落。通过将分子简化为核心骨架并在数千个已申请专利的 PROTACs 中进行可视化,他们展示了自己的样本跨越了多种不同的结构类型,尤其是在柔性连接链方面。这意味着该模型适合用于改进那些共享关键构建模块但在部件连接方式上存在差异的 EGFR 定向 PROTACs。同时,作者强调该工具是领域专家型的:对于围绕完全不同靶点或降解通路构建的 PROTACs,其准确性可能下降,这表明未来需要通过扩展数据集和迁移学习来提升适用范围。
这对未来药物意味着什么
对非专业读者来说,主要结论是药物在体内的“管路”——它如何被吸收、到达何处以及停留多久——可以成就或毁掉有前途的癌症疗法,而用于小分子药物的常规捷径对新一代降解剂如 PROTACs 并不适用。通过创建 EGFR-PROPK,研究者表明精心收集的动物数据结合先进的模式识别方法,可以在早期更清晰地预测这些复杂分子的体内行为。这类量身定制的预测应能帮助化学家设计既能摧毁正确蛋白又能以合适水平到达靶点的 PROTACs,为对抗耐药癌症的更有效、更安全治疗铺平道路。
引用: Zhang, R., Li, F., Liu, Y. et al. A machine learning-based pharmacokinetics predictor (EGFR-PROPK) for EGFR-targeting PROTACs. Commun Chem 9, 134 (2026). https://doi.org/10.1038/s42004-026-01938-3
关键词: PROTAC 药代动力学, 靶向 EGFR 的降解剂, 机器学习在药物设计中的应用, ADMET 预测, 靶向蛋白降解