Clear Sky Science · zh
利用泛基因组的线性参考发现自闭症缺失变异
为什么隐藏的DNA变化对自闭症很重要
大多数为自闭症儿童寻求基因检测的家庭希望得到明确答案,但大约五分之四的家庭未能获得决定性的遗传学解释。本研究针对的关键原因之一是:许多有重要影响的DNA变化对标准检测而言过于复杂而难以被发现。研究人员为来自51个与自闭症相关家庭的189名个体构建了近乎完整的基因组,并将它们与新的、更丰富的“泛基因组”参考进行比较,展示了先进测序如何揭示罕见且此前不可见的突变,这些突变或许有助于解释部分自闭症及相关疾病的病例。
超越标准基因检测的视角
传统临床检测依赖短片段DNA来扫描个体基因组。这对许多单个碱基的改变效果良好,但常在重复或结构复杂的区域失灵,恰恰这些区域经常藏有某些具有强致病性的突变。团队针对那些此前通过短读长基因组、外显子组或基因面板检测未能找到自闭症或类瑞特症状原因的家庭。通过长读长测序(可读取更大范围的DNA片段),他们构建了189名个体的高质量、相位分辨的基因组组装体。这意味着他们能够以极少缺口重建每个人来自父母的两套染色体拷贝。

结构变异:大幅度改变带来大影响
研究者并非仅追踪单核苷酸差异,而是聚焦于结构变异——插入、缺失和重排等影响至少50个碱基、可能破坏基因或其调控开关的改变。每名儿童大约携带27,000个此类变异,但绝大多数是人群中无害的背景差异。通过将这些自闭症家庭与来自多样族群、具有深度测序的数百个泛基因组对照基因组进行比较,团队能够为每名儿童过滤掉超过97%的常见结构变异,留下大约600个罕见候选变异;当使用更大对照集时,这一数目可降至约200个。
在已知风险基因中发现被遗漏的突变
在显著缩小的搜索空间中,作者整合了多条证据线:已知的自闭症与神经发育障碍相关基因、在发育中人类大脑皮层中活跃的调控区域,以及每个家庭内的遗传模式。他们发现了三处明确致病的突变,先前的检测未能发现。其中包括SYNGAP1基因中的新终止密码子,该基因对突触功能至关重要;以及一个删除突变切掉了MECP2基因的最后一个外显子(MECP2为关键的瑞特综合征基因),而患者此前曾接受多次临床检测却未检测出该变异。他们还证实了TBL1XR1中的致病改变,该基因与MECP2有相互作用。总体上,研究者还标注了九个额外的结构变异——通常为遗传获得并位于靠近脑相关基因的调控区——作为未来功能验证的有力候选。
研究未发现的内容——以及这为何仍然重要
尽管进行了深入搜索,作者并未在自闭症儿童与其未受影响的兄弟姐妹之间观察到结构变异总体过量的明确证据,至少在这有限的样本量中如此。然而,研究中出现了一个迹象:受影响女孩在X染色体上可能有更多的结构改变;几乎完整的X和Y染色体组装使他们能够发现诸如X染色体失活极度偏斜等不寻常模式。这些特征随着更多家庭被研究可能成为重要线索。关键在于,这项工作表明长读长测序能够恢复短读长方法遗漏的致病变异,尤其是在基因组的棘手区域和调控基因活性的重要控制区。

这对家庭和未来检测意味着什么
对于家庭而言,直接影响虽有限但意义重大:在这些难以解决的病例中,约有6%的家庭获得了明确的基因学诊断,近五分之一获得了有力的新候选变异以供进一步研究。对整个领域而言,意义更为深远。随着更多多样且完整的参考基因组被加入泛基因组,并且长读长测序变得更易获得,临床医生将能迅速排除常见的结构改变,集中精力在每位患者少量罕见且潜在有害的变异上。这样的转变可能逐步把今天大量“未解”的自闭症病例,转化为能够更好理解其生物学基础——以及可能的支持与治疗途径——的病例。
引用: Sui, Y., Lin, J., Noyes, M.D. et al. Using the linear references from the pangenome to discover missing autism variants. Nat Commun 17, 1681 (2026). https://doi.org/10.1038/s41467-026-68378-4
关键词: 自闭症遗传学, 长读长测序, 结构变异, 人类泛基因组, 瑞特综合征