Clear Sky Science · zh
人类微蛋白图谱平台对人类微蛋白的全面注释与分析
潜力巨大的隐匿蛋白
我们的DNA编码着比科学家曾认为的更多的微小蛋白,这些被忽视的分子可能在细胞生长、通信和发病过程中悄然发挥作用。本研究介绍了人类微蛋白图谱——一个涵盖数十万这种微型蛋白的大型图谱,为研究人员提供了探索它们结构、细胞定位及在健康与疾病中可能功能的途径。

什么是微蛋白及其重要性
多年来,研究者主要关注产生全长蛋白的传统基因。短的DNA片段常被当作背景噪声忽略。然而,新型实验工具显示,许多小片段被细胞积极翻译,生成仅由数十个氨基酸构成的微蛋白。已知的若干例子参与调控脂质代谢、微调免疫系统或抑制癌变,提示存在一层被忽视的广泛生物学机制。
构建微小蛋白的全球图谱
作者从多个公共资源收集了617,462个小开放阅读框,并将其转换为相应的微蛋白序列。随后他们使用先进的软件和深度学习模型,为每个微蛋白预测了从基本化学性质到详细三维构象的一系列特征。所有信息被整合到名为“人类微蛋白图谱”的平台中,可通过交互式网站浏览,用户可按序列、邻近基因或结构相似性进行搜索。
形状、柔性与细胞内定位
研究团队利用AlphaFold2预测了数十万微蛋白的结构,发现了显著的多样性。许多微蛋白呈简单的螺旋形状,而另一些则缺乏稳定框架,更像柔性的链状分子。这种柔性暗示微蛋白可能作为动态调节因子而非刚性的机器。将预测结构输入其他工具后,研究者推断出可能的功能,发现许多微蛋白似乎参与细胞信号传导与调控。另一个模型预测了它们在细胞内的分布,大量被定位于细胞质、细胞核和线粒体,另有部分被预测为分泌到细胞外,与细胞与组织间通信的作用相一致。
预测重要性、突变风险与活性
该图谱还评估了每个微蛋白可能的重要性及其对遗传变异的敏感性。专门的模型为它们在不同组织中的“必需性”打分,显示有些微蛋白在肾脏或造血组织等特定器官中显得至关重要,而许多其他则相对不那么关键。另一个深度学习方法评估了单个碱基突变的潜在危害,结果表明更长且结构更稳定的微蛋白通常对改变更为脆弱。最后,通过在已知的医药与天然肽上训练数十个活性预测器,作者估计了哪些微蛋白可能具有抗菌活性、信号分子功能或作为潜在药物载体,突出了适合进一步实验验证的重点候选集。

该资源如何指导未来医学
为展示图谱的应用,研究者检索了可能影响胰腺癌的微蛋白。他们鉴定出在患者中水平下降但被预测具有强抗癌活性并与已知的DNA修复和能量代谢蛋白有重要相互作用的小蛋白。尽管这些预测仍需实验验证,但展示了人类微蛋白图谱如何迅速提出有前景的靶点。总体而言,该资源将先前不可见的人类蛋白组层面转化为可检索的景观,帮助科学家锁定有望成为未来诊断标志或新疗法构件的微小蛋白。
引用: Kang, B., Fan, R., Ji, X. et al. Comprehensive annotation and analysis of human microproteins by human microprotein atlas platform. Commun Chem 9, 188 (2026). https://doi.org/10.1038/s42004-026-02054-y
关键词: 微蛋白, 小开放阅读框, 蛋白质图谱, 深度学习, 胰腺癌