Clear Sky Science · zh
从序列到结构:揭示拉沙热病毒群体层面的生物物理特性与糖蛋白结构目录
为什么病毒的微小变化很重要
拉沙热每年在西非影响数万人,但我们仍缺乏有效疫苗。引发该病的拉沙病毒存在若干地区性变体或谱系,它们在致病性和对抗体的敏感性上有所不同。本研究提出一个简单却有力的问题:在物理层面上,这些病毒谱系彼此究竟有多大差异?这些差异能否帮助科学家设计更好的疫苗和治疗手段? 
把病毒当作由若干零件构成的整体来观察
研究者将病毒视为由四个主要部分组成的“工程化”对象:允许进入细胞的表面棘突、包裹遗传物质的衣壳、复制基因组的酶,以及帮助新颗粒从受感染细胞出芽的小蛋白。他们从公共数据库汇编了数百条高质量序列,并为每个蛋白测量了简单明了的性状,如长度、估计质量以及所用氨基酸的类型。通过跨谱系比较这些性状,可以观察到某些谱系是否持续产生更重或在组成上不同的同一种蛋白。
蛋白更重但并不更长
在病毒的小基因组片段编码的两种蛋白——表面糖蛋白复合体和核蛋白——中出现了一个显著模式。在尼日利亚,两种谱系(称为II和III)在不同地区流行。它们的糖蛋白长度几乎总是相同,然而谱系III的版本平均比谱系II重约180质量单位。核蛋白也呈现相同趋势:谱系III的版本大约比谱系II重140单位,尽管氨基酸数量完全相同。这说明谱系III在若干位点偏好稍重的氨基酸,从而在不增加长度的情况下使其蛋白更重。
定位蛋白差异的位置与方式
为了找出这些差异在糖蛋白上的位置,团队结合了机器学习和统计测度。一个随机森林分类器仅凭序列的整体氨基酸组成就能较高准确地预测其谱系,表明每个谱系具有微妙但独特的化学“口音”。当作者放大到单个位点时发现,超过一半的糖蛋白在谱系II与III之间基本共享,而一小部分位点显示出强烈的谱系偏好。在这些位点,谱系III倾向于使用较重的残基,如精氨酸和谷氨酰胺,而谱系II则偏好较轻的残基,如缬氨酸和丙氨酸。将这些微小位点偏移累加起来就能解释两谱系间总体质量的差距。
病毒可以容忍的微小插入
糖蛋白的长度在某些谱系间也存在一个氨基酸的差异。大多数IV和V谱系的病毒具有491个氨基酸的糖蛋白,而谱系II、III和VII则更常见490个。通过仔细重比对序列并构建大型家族树,研究者将这一长度差异追溯到糖蛋白极其靠近起始处的一段短插入/缺失,位于约第60和61位点附近。随后他们使用现代结构预测软件对三聚体糖蛋白棘突的600多种版本进行了建模。 
从计算模型到细胞实验
结构模型显示,额外的残基位于糖蛋白头部的外表面,并未扰动各谱系共享的核心构架。为测试这一微小变化在活细胞中的影响,团队在人体细胞系中表达了若干代表性糖蛋白构建体,含或不含该额外氨基酸。他们测量了这些蛋白到达细胞表面的效率以及两种构象敏感抗体的结合强度。在各构建体间,表达和抗体结合差异很小,这表明这一特定长度差异是可以被容忍的,并不会在该实验条件下大幅改变糖蛋白的展示或被识别方式。
对未来疫苗的意义
总体而言,该研究表明拉沙病毒谱系在蛋白质物理特性层面并不完全相同。尤以谱系III为代表,通过在特定位点偏好较重的氨基酸来产生关键蛋白的稍重版本;同时,糖蛋白顶端附近的一个小插入在结构和功能上似乎是可接受的。通过将群体尺度的序列分析与结构建模和实验室测试相结合,作者提供了一个跨谱系糖蛋白形态的详细目录。该资源可帮助疫苗与药物设计者选择具有代表性的靶标,并聚焦于在结构上保守的区域,即便病毒序列仍在不断演化。
引用: Daodu, R.O., Riccabona, J.R., Peter, A.S. et al. Sequence to structure insights into Lassa virus population-level biophysical properties and glycoprotein structure catalogue. npj Viruses 4, 26 (2026). https://doi.org/10.1038/s44298-026-00196-3
关键词: 拉沙热病毒, 糖蛋白, 病毒谱系, 蛋白质结构, 疫苗设计