Clear Sky Science · zh

解开协同进化约束以模拟蛋白质构象异质性

· 返回目录

蛋白质:会变形的分子机器

蛋白质是维持生命所需的微小机器,许多蛋白质通过细微的构象变化来发挥功能。这些变化可以开启或关闭信号,打开或关闭分子闸门,或重塑药物欲结合的口袋。然而,大多数计算工具仍试图为每个蛋白质指定一个“正确”的结构,掩盖了构成健康与疾病基础的柔性。本文提出了EvoSplit,一种从蛋白质序列中读取进化记录的新方法,用以发现多种具有功能意义的构象——其中一些尚未被实验观测到,可能为药物发现开辟新途径。

Figure 1
Figure 1.

蛋白质柔性对医学的重要性

在细胞内,蛋白质很少静止。它们弯曲、扭转,有时在温度、酸碱度、结合伙伴或化学修饰变化时甚至会部分重折叠。这类运动可以很小,例如一些侧链的位移,也可以很剧烈,例如整段从螺旋翻转为片层。这些变化对受体感知激素、转运蛋白跨膜运输分子,以及致癌蛋白驱动癌变等过程至关重要。如果我们只知道蛋白质的一个快照,就可能错过活性构象、可成药的口袋或导致疾病的构象。因此,捕捉蛋白质各稳定形态的准确“角色表”对于理解生物学和设计靶向疗法至关重要。

解读进化的隐含注记

在数百万年的演化中,蛋白质序列在选择压力下演化,不仅维持单一结构,往往还会保留若干生物学相关的形态。当两个氨基酸在相关蛋白中以协调方式共同突变时,这提示它们至少在一种构象中必须保持接触。现代深度学习系统(如AlphaFold2)之所以表现出色,是因为它们从大量相关序列组成的多序列比对中挖掘此类协同进化模式。然而,当蛋白质能采用多种折叠时,不同状态的信号会相互混合,而标准方法通常将它们塌缩为单一平均结构。早期方法试图通过基于整体相似性的序列聚类来区分这些状态,但这些方法在很大程度上忽视了实际上编码结构偏好的成对模式。

EvoSplit如何分离重叠的构象

作者基于一种名为MSA Transformer的蛋白语言模型,该模型使用注意力机制来学习哪一序列中的哪些残基“相互关注”。他们展示出,对于具有多种已知结构的蛋白质,每条序列的注意力模式往往更像某一特定构象的接触图,而非其他构象。换言之,每条序列携带着对其偏好形状的指纹。EvoSplit利用这一点,将注意力矩阵——而非原始序列相似性——作为特征对比对进行聚类。然后将每个簇分别输入AlphaFold2,实际上为结构预测器提供了更干净、构象特异性的进化提示。在85个已知会切换折叠的蛋白上,EvoSplit生成的模型在与实验结构的一致性和置信度方面均优于一种领先的基于序列的聚类方法,尤其在对采样较少的那一状态上表现更佳。

在训练数据之外发现新状态

对强大神经网络的一个关键担忧是,它们可能只是“记住”训练集中的结构,而非发现新结构。为检验EvoSplit是否真能提供额外信息,作者转向了一组运输蛋白和受体,这些蛋白的替代状态未包含在AlphaFold2的原始训练集中。即便如此,EvoSplit仍然恢复了向内和向外的构象,以及独特的活性与非活性形态,并且与实验模型具有高结构相似性。该方法还可扩展到更具探索性的任务:在对100多种与人类癌症相关的蛋白应用时,它标注出了54个可能采用多种构象的候选者。对于其中一些蛋白,例如激酶LCK和细胞周期调控因子cyclin D1,EvoSplit提出了与相关蛋白已知结构相呼应的域排列,提示存在尚未观测但在生物物理上合理的状态。

Figure 2
Figure 2.

癌症相关开关中的令人惊讶的新折叠

也许最有趣的结果涉及小型GTP酶,如HRAS和KRAS,这类分子开关在肿瘤中经常发生突变。这些蛋白通常通过结合位点附近的细微重排在“开”和“关”之间切换,同时保持其余折叠不变。然而,EvoSplit反复预测出一种替代构象:蛋白起始附近的一段螺旋转换为片层,改变了整体拓扑。这一模式在五个相关的GTP酶中出现,表明这并非偶然。对这种异常状态的模拟在数百纳秒尺度上保持稳定,进化耦合分析显示出与其独特片层接触一致的不同接触信号。当作者模拟HRAS与若干已知结合伙伴的相互作用时,经典构象和新构象都能形成稳定复合体,但接触界面发生了偏移,暗示该替代折叠可能支持不同的信号传导行为。

这对未来药物设计意味着什么

对非专业读者而言,核心信息是:我们的蛋白质可能蕴含比传统结构预测揭示的更多形态——因此也存在更多功能可能性。EvoSplit利用进化引导的模式识别来分离这些隐藏状态,而不是将它们平均化。通过在已知折叠切换蛋白上优于早期方法、在研究充分的受体和转运蛋白中发现替代状态,以及为像HRAS这样的癌症相关开关提出稳定的新折叠,这项工作主张多态建模应成为常规做法。从实用角度看,更丰富的结构目录可以发现新的药物口袋,解释某些突变为何有害,并指出仅在超越单一静态结构时才会显现的通路。

引用: Li, S., Zhang, C., Kong, L. et al. Disentangling coevolutionary constraints for modeling protein conformational heterogeneity. Commun Chem 9, 146 (2026). https://doi.org/10.1038/s42004-026-01940-9

关键词: 蛋白质构象动力学, 协同进化信号, AlphaFold2, 与癌症相关的蛋白质, GTP酶折叠转换