Clear Sky Science · zh

VISDB 2.0:一个人工整理的人类疾病中病毒整合位点及其调控图谱资源

· 返回目录

为何病毒改写我们的 DNA 至关重要

许多常见病毒并不会仅仅感染细胞然后离开——它们可以将自身基因片段嵌入我们的 DNA 中。这些隐蔽的“编辑”能够帮助病毒长期潜伏,有时也会推动细胞走向癌变。到目前为止,有关病毒在人体基因组中整合位置以及这些位点功能的信息散见于数百篇研究之中。本文介绍了 VISDB 2.0,这是一个大幅扩展的在线资源,将这些发现汇聚在一起,帮助科研人员追踪病毒 DNA 插入如何驱动疾病并揭示新的药物靶点。

Figure 1
Figure 1.

病毒如何留下持久的遗传足迹

如乙型肝炎病毒、人乳头瘤病毒、埃普斯坦—巴尔病毒、HIV 等病毒可以将其遗传物质直接整合到人类染色体中。对于某些 DNA 病毒,这种整合是其生命周期的一部分;而对某些称为逆转录病毒的 RNA 病毒,病毒 RNA 首先被转录为 DNA,随后并入宿主基因组。这些插入并非完全随机——它们常常出现在控制基因开关的关键位置,比如调控细胞生长和免疫反应的区域。当病毒 DNA 破坏这些控制面板时,可能改变细胞行为、促成慢性感染或助长癌症发生。

从支离破碎的线索构建完整图谱

过去二十年里,科学家开发了多种实验和计算方法来检测病毒 DNA 的整合位点——从定向实验检测试验到全基因组测序和深度学习模型。然而,所得数据分散在大量论文和少数不完整的数据库中,使得全面把握变得困难。VISDB 2.0 通过对 2020 至 2025 年间发表的 209 篇同行评审研究以及早期资源进行大规模人工整理来解决这一问题。作者核查了每个报告的整合位点,确保坐标与当前人类基因组参考一致,去除重复,并仅保留精确定位的事件。最终产出是一个标准化目录,包含跨 11 种医学相关病毒和 45 种人类疾病的 270,470 个高置信度病毒整合位点。

将病毒足迹与基因调控和疾病联系起来

VISDB 2.0 不仅列出病毒整合的位置,还详细描述了每个位点在人类基因组周围的状况。数据库记录插入是否位于或邻近基因——包括已知的致癌基因和抑癌基因——以及是否靠近 CpG 岛、染色体易碎区或易断裂的重复序列。它还叠加了丰富的调控和表观遗传信息:检查整合位点是否与基因启动子、增强子、转录因子结合位点、开放染色质、典型组蛋白修饰和与疾病相关的遗传变异重叠。通过系统地将真实整合位点与基因组中随机位置比较,作者表明病毒偏好特定的调控街区,而不是随意沉降。

从序列模式到治疗可能性

为了解为何某些位点更受偏好,研究组检查了每个整合位点周围的局部序列,扫描短 DNA 片段以寻找类似人类调控蛋白结合位点的重复模式。这揭示了可能引导病毒整合或随后影响附近基因调控的“着陆基序”。VISDB 2.0 还将病毒整合与非编码 RNA 联系起来——这些小型和长链 RNA 不编码蛋白,但在感染、免疫反应和癌症中具有重要作用。通过将整合位点匹配到已知的非编码 RNA 及其靶基因,数据库突出了可能被病毒活动重连的通路。最后,作者将 DrugBank 中成千上万种药物映射到受病毒插入影响的基因上,构建了一张基于真实病毒—宿主相互作用的潜在治疗与药物再利用网络。

Figure 2
Figure 2.

研究病毒—人类相互作用的新起点

通俗地说,VISDB 2.0 类似于一部升级后的图集,它不仅显示病毒在何处在人体 DNA 上留下印记,还显示这些印记所在的“街区”、居住在那里的“居民”(基因)以及哪些药物可能影响它们。数据可供批量下载,并通过网页界面提供,允许用户按病毒、基因、基因组区域或疾病进行检索,并可可视化整合模式及其调控环境。通过将分散的发现整合为一套连贯且经质量检查的资源,VISDB 2.0 为研究病毒感染如何促成癌症及其他疾病提供了强有力的基础,并为将这些知识转化为更好的诊断和靶向治疗铺平了道路。

引用: Citu, C., Singh, A., Liu, X. et al. VISDB 2.0: A manually curated resource of viral integration sites and their regulatory maps in human diseases. Sci Data 13, 695 (2026). https://doi.org/10.1038/s41597-026-07069-7

关键词: 病毒整合, 人类基因组, 癌症基因组学, 调控 DNA, 生物信息学数据库