Clear Sky Science · zh
跨界王国的预测蛋白复合体结构图谱
为什么绘制蛋白伙伴关系很重要
你体内的每个细胞都充满了由蛋白质构成的微型分子机器。这些蛋白很少单独工作;它们成对或成组协作以执行几乎所有生命活动。然而,尽管科学家已知数以百万计的潜在蛋白伙伴关系,只有一小部分拥有详尽的三维蓝图。本研究利用人工智能预测了跨细菌、古菌、植物、动物和病毒超过一百万对蛋白如何配合,创建了一个可指导未来生物学和医学研究的图谱。
构建大规模蛋白配对地图
研究者旨在以前所未有的规模预测蛋白复合体的形状。他们使用基于AlphaFold的工具,这些工具能够根据氨基酸序列推断蛋白结构,并将其应用于来自大型公共相互作用数据库和基因组数据的候选蛋白配对。总体上他们建模了大约110万对可能的蛋白配对,然后施以严格的质量检查以判断哪些预测是可靠的。这些检查侧重于蛋白表面如何契合以及基于若干独立评分方法界面看起来有多牢固。
经过筛选,团队获得了181,671个高置信度复合体。其中包括来自细菌和古菌的超过10万个复合体,来自人类蛋白的超过37,000个,以及近20,000个来自小鼠和植物的复合体。这一丰富的预测形状集合使他们能够对外观相似的复合体进行聚类,揭示在生命树遥远分支中反复出现的常见配对模式。这类重复出现的构型暗示了进化中被多种生物反复采用的古老解决方案。

揭示微生物中的隐秘机器
该图谱对于微生物特别有价值。在细菌和古菌中,共同发挥作用的基因常常在染色体上相互接近。通过将这一简单的基因组法则与他们的结构预测结合,作者鉴定出了超过10万对可能的物理伙伴关系,其中包括许多病原细菌中的配对。通过追踪这些相互作用网络,他们能够重建大型分子装配体,例如被称为核糖体的蛋白质工厂的部分构件,以及帮助细菌处理非凡营养物质的复杂外壳。他们还展示了较小的重复单元如何堆叠成复杂的多层机器,提出了关于细菌毒力系统构建方式的假设。
连接人类蛋白与病毒伎俩
团队还聚焦于病毒如何与人类蛋白相连。利用经人工整理的预测人-病毒接触数据库,他们建模了超过80,000个候选相互作用,并发现超过5,000个通过了置信度阈值。一些人类蛋白表现为枢纽,被许多不同病毒接触,包括帮助控制细胞信号传导的14-3-3家族成员。模型暗示某些病毒蛋白可能占据人类蛋白上通常被另一个人类配体使用的相同表面,有如插队般干扰正常的细胞过程。实验室实验证实了若干预测的接触,包括与人细胞已知或潜在入侵点结合的病毒蛋白。

通过形状追溯蛋白历史
除了编目现今的复合体外,作者还利用该图谱探索蛋白的演化历史。通过将他们复合体中的每个配体与AlphaFold数据库中数以百万计的单一蛋白结构进行比较,他们发现许多情况下,两种现代互作蛋白分别类似于另一物种中单一更长蛋白的不同片段。这些模式指向过去的融合事件(基因连在一起)或裂变事件(曾连续的基因分裂为若干部分)。研究还发现一些病毒或微生物蛋白在形态上与人类复合体高度模拟,提示长期的进化压力促使保存某些构型。
从图谱到实用工具
为了证明他们的图谱不仅是静态参考集,科学家们用它来改进一种预测蛋白表面哪些位点会与配体形成接触的深度学习模型。对高质量预测复合体的训练增强了该模型识别真实实验解析结构上结合位点的能力。这表明,即便实验数据有限,大规模的准确预测集合也能反哺新方法,并能助力药物发现、蛋白工程和疫苗设计等工作。
这对未来意味着什么
对非专业读者而言,关键信息是:我们现在拥有了一个首版草图,描绘了大量蛋白配对在多种生命形态中可能如何契合。虽然并非完美,但该图谱大大扩展了研究人员可用的结构信息。它为理解感染如何建立、细胞机器如何构建以及蛋白家族如何随进化改变提供了起点。随着实验验证细化这些预测,并且类似图谱扩展到更多类型的分子,这类地图终将成为探索并最终重新设计生命分子机器的必要指南书。
引用: Qi, X., Ye, C., Liang, J. et al. Atlas of predicted protein complex structures across kingdoms. Nat Commun 17, 4397 (2026). https://doi.org/10.1038/s41467-026-70884-4
关键词: 蛋白复合体, AlphaFold, 蛋白相互作用, 人-病毒相互作用, 结构生物学