Clear Sky Science · zh

一种用于研究DUX4和DUX4C的新型整合基因组与转录组方法

· 返回目录

染色体末端的基因

在染色体的最末端存在高度重复的DNA序列,这些区域以难以研究著称。位于这一迷宫中的两个基因——DUX4和DUX4C——已与一种肌营养不良和若干癌症相关,但由于常规遗传学工具难以区分它们,其确切作用长期不明。本研究引入了新的方法来读取和解释这些混乱的区域,揭示了不同版本的DUX4和DUX4C如何影响疾病风险和免疫行为。

解开这对长得很像的基因

DUX4和DUX4C位于第4号染色体端部相邻位置,周围环绕着数十个几乎相同的重复单元。短读长的DNA测序是现代遗传学的主力,但往往无法区分这些重复单元、DUX4与DUX4C,或散布在基因组各处的同源序列。为了解决这一问题,研究者结合了长读长和短读长测序来重建DUX4和DUX4C最常见的全序列单倍型。随后他们构建了一个自定义参考基因组,称为D4Ref-T2T,用以替换原先混乱的重复区,明确地放置每种主要单倍型的拷贝,从而使常规测序数据能够更精确地比对。

Figure 1
Figure 1.

常见的基因变体及其携带者

利用来自欧洲和日本人群的大型公共数据集,研究团队鉴定出两个主要的DUX4C单倍型,命名为4qα和4qβ。这些版本在基因末端附近的一个调控区存在少数DNA差异,且在欧洲人和日本人中的频率相近。当他们检查DUX4时,证实现有参考基因组仅准确代表其部分形式,而且一个被广泛使用的参考将与疾病相关的DUX4单倍型的某些部分错位。借助新的D4Ref-T2T参考,他们能够更可靠地对这两个基因进行基因分型,并发现DUX4C-4qα版本常与一种特定的DUX4变体(称为4qB)共遗传,显示出这两个位点之间存在强烈的遗传连锁。

来自DUX4C的新型转录产物

除了DNA本身,科学家们还探究了DUX4C在活细胞中如何转录为RNA。利用在干扰素刺激下的人类免疫细胞系进行的长读长RNA测序,他们重建了完整的DUX4C转录本,并发现了两个此前未被描述的RNA异构体,具有明确的起始和终止区域。这些异构体翻译出的一种蛋白保有与DUX4相同的DNA结合结构域,但缺乏其经典的激活尾部。相反,DUX4C的尾部本质上是无定形的,富含短序列基序,这类基序常作为其他蛋白或信号分子的灵活对接位点,提示DUX4C可能充当一个调控枢纽,而非简单的基因开/关开关。

Figure 2
Figure 2.

基因何时何地被激活

研究团队接着询问DUX4和DUX4C在何时何地在人类组织中表达。通过重新分析来自乳腺肿瘤、FSHD患者的肌肉活检和干扰素刺激的免疫细胞系的RNA数据,他们发现了不同的表达模式。与正常乳腺组织相比,乳腺肿瘤中DUX4和DUX4C均呈上调;而在FSHD肌肉中,只有DUX4持续性地升高。DUX4C在FSHD样本中大多沉默,尽管少数未受影响的家族成员显示出适度水平,表明DUX4C对肌肉的损伤性可能低于DUX4,甚至可能具有保护或修复相关的作用。在免疫细胞系中,单纯的干扰素处理并未强烈诱导这两个基因的表达。

指引免疫反应的线索

最后,研究者聚焦于一小组在DUX4C和DUX4单倍型以及DUX4C表达状态上存在差异的免疫细胞系。携带DUX4C-4qα / DUX4-4qB组合并积极表达DUX4C的细胞,显示出与免疫细胞迁移相关基因(如白细胞与淋巴细胞趋化)活性增加。结合DUX4C蛋白尾部中发现的信号基序,这些结果提示DUX4C可能在特定遗传背景下辅助引导免疫细胞的迁移或活化,从而可能影响肿瘤与炎症组织被免疫系统监视的方式。

这项工作的意义

通过为DUX4和DUX4C构建量身定制的基因组与转录组图谱,本研究提供了看清人类基因组中最重复且易错区域的工具。结果表明,不同版本的这些基因存在紧密连锁且可能相互作用:DUX4作为已知的肌肉损伤和免疫抑制驱动因子,而DUX4C则可能作为免疫信号和细胞迁移的调节者。这些见解为更好地诊断FSHD、更加准确地解释癌症测序数据以及进一步研究染色体端细微差异如何影响组织损伤、修复与免疫防御的平衡打开了大门。

引用: Zhuang, Z., Ueda, M.T., Yamaguchi, K. et al. A new integrated genetic and transcriptomic approach for investigating DUX4 and DUX4C. J Hum Genet 71, 373–381 (2026). https://doi.org/10.1038/s10038-025-01450-x

关键词: DUX4, DUX4C, 面肩肱型肌营养不良(FSHD), 乳腺癌, 免疫趋化