Clear Sky Science · zh

GGC 重复扩展在新的开放阅读框内被翻译为在眼咽远端肌病中有毒的多甘氨酸蛋白

· 返回目录

我们 DNA 中的隐藏信息

我们大多数人在学校学到的是,只有一小部分 DNA 实际上编码蛋白质,其余部分曾被视为“垃圾”。这项研究颠覆了这个观点。它表明,那些被忽视的小片重复 DNA 区段可以悄然产生新的蛋白质,损害肌肉和大脑,从而帮助解释一类罕见但严重的神经疾病——并指向一种潜在的治疗途径。

重复 DNA 与神秘的肌病

我们的基因组充满了微小的重复序列,就像三字母音节一次又一次地复制。当这些重复序列过长时,会导致 60 多种已知的人类疾病。在眼咽远端肌病(OPDM)及伴有脑改变的相关疾病 OPML 中,患者出现眼睑下垂、吞咽困难、手脚无力,有时还伴随更广泛的神经和脑部问题。在显微镜下,医生可以看到肌肉和神经细胞内特有的蛋白质凝聚体,但直到现在仍不清楚位于所谓“非编码”区域的重复如何产生有毒蛋白。

Figure 1
Figure 1.

秘密产生蛋白质的非编码区

研究者关注了在多个与 OPDM 和 OPML 相关基因中重复多次的三核苷酸序列 GGC。这些重复位于被注释为非编码的区域——基因的未翻译尾端或被认为不产生蛋白质的长 RNA 中。通过在细胞中重建这些人类序列并追踪其被翻译的方式,团队发现每一段 GGC 重复实际上位于一个此前未被识别的小开放阅读框(small open reading frame)内。当细胞阅读这些隐藏的指令时,每个 GGC 重复被翻译为氨基酸甘氨酸,从而在新产生的微蛋白上形成异常长的“多甘氨酸”尾端。

形成凝集并致细胞死亡的新有毒蛋白

利用定制抗体,科学家证明这些带有多甘氨酸的微蛋白在患者的肌肉样本中存在,并且集中在那些异常的 p62 阳性蛋白凝聚体所在的位置。随后他们强制使人类肌肉细胞、果蝇和小鼠产生相同类型的多甘氨酸蛋白。在这三种体系中,这些蛋白在细胞质和细胞核中凝聚成圆形、致密的包涵体,类似于患者组织中观察到的情况。产生这些蛋白的细胞更容易死亡,在小鼠中受影响的肌肉表现出肌纤维缩小、核内移位和炎症迹象。当这些蛋白在脑和心脏中积累时,动物出现运动障碍、神经退行性改变、心肌病以及寿命缩短,与患者报告的许多症状相符。

Figure 2
Figure 2.

同一核心毒性,局部表现各异

尽管这些微蛋白共享同一中心特征——一段长的甘氨酸链,但它们并非完全相同。每种蛋白来源于不同基因中的不同小阅读框,因此在多甘氨酸区段的上下游有独特的氨基酸片段。团队发现,这些周围片段强烈影响蛋白的行为:它们在细胞内积累的位置、形成聚集体的倾向、与哪些细胞伙伴相互作用,以及对肌肉和神经细胞的毒性程度。有些变体尤其具破坏性,能快速诱发包涵体形成和细胞死亡,而另一些则相对温和。这表明存在一个共同的毒性核心机制,但会被局部序列环境所微调。

迈向共同治疗策略的第一步

令人鼓舞的是,研究者还鉴定出一种小分子、带阳离子的卟啉类 TMPyP4,能够在细胞和果蝇模型中降低这些多甘氨酸蛋白的积累与毒性。TMPyP4 似乎主要通过干扰 GC 富集重复区的翻译发挥作用,减少有害蛋白的产生,而不会广泛抑制整体蛋白合成。虽然远非可立即投入临床的药物,但它提供了一个原理性证据,表明单一治疗策略未来可能帮助患有由类似重复扩展驱动的多种相关疾病的患者。

这对我们理解疾病意味着什么

对非专业读者而言,核心信息引人注目:长期被归为非编码的 DNA 片段可以隐藏小的蛋白配方,当某些重复扩展时,这些配方会变得危险。在 OPDM、OPML、神经元核内包涵体病及相关疾病中,扩展的 GGC 重复被翻译为粘性的多甘氨酸蛋白,这些蛋白在细胞内凝聚并逐步损害肌肉、神经和大脑。通过揭示这一共同机制并提出首个可减弱该机制的候选化合物,这项研究拓宽了我们对“基因”定义的视野,并为治疗这一不断扩展的由重复驱动的神经疾病家族开辟了新路径。

引用: Boivin, M., Yu, J., Eura, N. et al. GGC repeat expansions within new open reading frames are translated into toxic polyglycine proteins in oculopharyngodistal myopathy. Nat Genet 58, 517–529 (2026). https://doi.org/10.1038/s41588-026-02507-z

关键词: 眼咽远端肌病, 微卫星重复扩展, 多甘氨酸蛋白, 非编码 DNA 翻译, 神经退行性肌肉疾病