Clear Sky Science · fr

VISDB 2.0 : une ressource manuellement annotée des sites d’intégration virale et de leurs cartes régulatrices dans les maladies humaines

· Retour à l’index

Pourquoi les virus qui réécrivent notre ADN comptent

Beaucoup de virus courants n’« infectent » pas seulement nos cellules puis s’en vont : ils peuvent insérer des fragments de leur propre matériel génétique dans notre ADN. Ces « modifications » cachées permettent aux virus de persister pendant des années et peuvent parfois pousser les cellules vers le cancer. Jusqu’à présent, les informations sur les emplacements d’intégration des virus dans le génome humain et sur la fonction de ces loci étaient dispersées dans des centaines d’études. Cet article présente VISDB 2.0, une ressource en ligne largement étendue qui rassemble ces résultats, aidant les chercheurs à retracer comment les insertions d’ADN viral peuvent conduire à des maladies et révéler de nouvelles cibles thérapeutiques.

Figure 1
Figure 1.

Comment les virus laissent une empreinte génétique durable

Des virus tels que le virus de l’hépatite B, les papillomavirus humains, le virus Epstein–Barr, le VIH et d’autres peuvent intégrer leur matériel génétique directement dans les chromosomes humains. Pour certains virus à ADN, cela fait partie de leur cycle de vie ; pour certains virus à ARN appelés rétrovirus, l’ARN viral est d’abord converti en ADN avant de s’insérer dans le génome de l’hôte. Ces insertions ne sont pas aléatoires. Elles se produisent souvent à proximité d’interrupteurs importants qui contrôlent l’activation ou la répression des gènes humains, y compris des régions régulant la croissance cellulaire et les réponses immunitaires. Quand l’ADN viral perturbe ces panneaux de commande, il peut modifier le comportement des cellules, favoriser l’infection chronique ou contribuer au développement de cancers.

Construire une carte complète à partir d’indices épars

Au cours des deux dernières décennies, les chercheurs ont développé de nombreux outils expérimentaux et informatiques pour détecter les lieux d’intégration de l’ADN viral : des tests ciblés en laboratoire au séquençage du génome entier et aux modèles d’apprentissage profond. Cependant, les données résultantes ont été dispersées dans de nombreux articles et quelques bases partielles, rendant difficile la vision d’ensemble. VISDB 2.0 relève ce défi par une large curation manuelle de 209 études évaluées par des pairs publiées entre 2020 et 2025, ainsi que des ressources antérieures. Les auteurs ont vérifié chaque site d’intégration rapporté, veillé à ce que ses coordonnées correspondent à la référence actuelle du génome humain, supprimé les doublons et conservé uniquement les événements mappés avec précision. Le résultat est un catalogue standardisé de 270 470 sites d’intégration virale de haute confiance couvrant 11 virus d’importance médicale et 45 maladies humaines.

Relier les empreintes virales au contrôle des gènes et à la maladie

VISDB 2.0 ne se contente pas d’indiquer où les virus s’intègrent ; il décrit soigneusement ce qui se passe autour de chaque site dans le génome humain. La base enregistre si une insertion tombe à l’intérieur ou à proximité de gènes, y compris des gènes oncogènes connus et des suppresseurs de tumeurs, et si elle se situe près de régions riches en CpG, de régions fragiles des chromosomes ou de séquences répétées sujettes aux cassures. Elle superpose aussi des informations régulatrices et épigénétiques riches : les sites d’intégration sont comparés avec des promoteurs géniques, des enhancers, des sites de liaison des facteurs de transcription, de la chromatine accessible, des marques caractéristiques d’histones et des variants génétiques liés à des maladies. En comparant systématiquement les sites d’intégration réels à des emplacements aléatoires dans le génome, les auteurs montrent que les virus ciblent préférentiellement des quartiers régulateurs spécifiques plutôt que de s’insérer au hasard.

Des motifs de séquence aux possibilités thérapeutiques

Pour comprendre pourquoi certains emplacements sont préférés, l’équipe a examiné la séquence locale autour de chaque site d’intégration, parcourant de courts segments d’ADN à la recherche de motifs récurrents ressemblant à des sites de liaison pour des protéines régulatrices humaines. Cela révèle des « motifs d’atterrissage » potentiels qui pourraient guider l’intégration virale ou influencer la régulation des gènes voisins par la suite. VISDB 2.0 relie également l’intégration virale aux ARN non codants — petits et longs ARN qui ne codent pas de protéines mais influencent fortement l’infection, les réponses immunitaires et le cancer. En associant les sites d’intégration aux ARN non codants connus et à leurs gènes cibles, la base met en évidence des voies susceptibles d’être reconfigurées par l’activité virale. Enfin, les auteurs cartographient des milliers de médicaments de DrugBank vers des gènes affectés par des insertions virales, assemblant un réseau d’opportunités de traitement et de repositionnement fondé sur des interactions virus–hôte réelles.

Figure 2
Figure 2.

Un nouveau point de départ pour étudier les interactions virus–humain

Concrètement, VISDB 2.0 ressemble à un atlas amélioré qui montre non seulement où les virus ont laissé leur empreinte dans l’ADN humain, mais aussi dans quels quartiers ces marques se trouvent, quels habitants (gènes) y résident et quels médicaments peuvent les influencer. Les données sont librement disponibles en téléchargement massif et via une interface web qui permet aux utilisateurs de rechercher par virus, gène, région du génome ou maladie, et de visualiser les profils d’intégration et leur environnement régulateur. En unifiant des résultats dispersés en une ressource cohérente et contrôlée pour la qualité, VISDB 2.0 offre aux chercheurs une base puissante pour découvrir comment les infections virales contribuent au cancer et à d’autres maladies — et pour transformer ces connaissances en diagnostics améliorés et en thérapies ciblées.

Citation: Citu, C., Singh, A., Liu, X. et al. VISDB 2.0: A manually curated resource of viral integration sites and their regulatory maps in human diseases. Sci Data 13, 695 (2026). https://doi.org/10.1038/s41597-026-07069-7

Mots-clés: intégration virale, génome humain, génomique du cancer, ADN régulateur, base de données bioinformatique