Clear Sky Science · nl
Z-Calling: een hulpmiddel voor A/Z (2,6-diaminopurine) base-calling en dZ-DNA-detectie met PacBio HiFi-lezingen
Waarom een nieuw soort DNA ertoe doet
DNA wordt vaak beschreven als het universele bouwplan van het leven, opgebouwd uit vier bekende letters: A, T, C en G. Maar sommige virussen doorbreken die regel stilletjes, en vervangen de letter A door een chemische verwant genaamd Z die hun DNA steviger en moeilijker aan te vallen maakt. Deze ontdekking wijst op een verborgen laag van genetische diversiteit met grote implicaties voor biotechnologie, geneeskunde en zelfs gegevensopslag. De uitdaging is simpel te formuleren maar moeilijk op te lossen: hoe kunnen wetenschappers betrouwbaar dit ongebruikelijke Z-DNA vinden en in kaart brengen, vooral wanneer het vermengd is met gewoon DNA? Deze studie introduceert Z-Calling, een computationeel hulpmiddel dat dat eindelijk mogelijk maakt met bestaande long-read sequencing-technologie.

Een vreemde letter in het genetische alfabet
Bij de meeste organismen paart de base adenine (A) met thymine (T) via twee waterstofbruggen, wat helpt de klassieke DNA-dubbelhelix te stabiliseren. Sommige bacteriophagen — virussen die bacteriën infecteren — hebben zich zodanig ontwikkeld dat ze A vervangen door 2,6-diaminopurine, bijgenaamd Z. Z vormt drie waterstofbruggen met T, waardoor de DNA-helix stabieler wordt en haar fysische eigenschappen veranderen. Deze ongewone chemie kan Z-bevattende virussen een voordeel geven tegen gastheerverdedigingen en opent mogelijkheden voor ontworpen moleculen met betere prestaties. Onderzoekers hebben al aangetoond dat Z genetische tests kan verscherpen, CRISPR-gene-editing kan afstemmen en immuunreacties op experimentele RNA-geneesmiddelen kan verminderen. Zonder een manier om precies te bepalen waar Z in een DNA-streng zit, was het echter moeilijk deze voordelen volledig te begrijpen of te benutten.
Huidige hulpmiddelen schieten tekort
Standaard DNA-sequencingtechnologieën gaan ervan uit dat alle A-achtige signalen echt A zijn, waardoor ze Z vaak als gewone adenine lezen. Chemische methoden zoals high-performance liquid chromatography kunnen detecteren hoeveel Z in bulk aanwezig is, maar ze kunnen niet zeggen waar elke Z zich in een genoom bevindt, vooral niet in verwarde milieumonsters die veel soorten mengen. Sommige sequencingplatforms van de derde generatie, zoals nanopore-apparaten, zijn theoretisch gevoelig genoeg om het verschil tussen basen te voelen, maar in de praktijk kunnen hun signalen ruisig en moeilijk te interpreteren zijn bij ongebruikelijke chemie. Tot nu toe bestond er geen handige, betrouwbare manier om complexe DNA-mengsels te scannen en normaal DNA duidelijk te scheiden van Z-bevattend DNA, of om A en Z letter voor letter uit elkaar te houden.
Luisteren naar het ritme van DNA-synthese
De auteurs concentreerden zich op PacBio Circular Consensus Sequencing, een technologie die hetzelfde DNA-molecuul herhaaldelijk kopieert en niet alleen registreert welke base wordt toegevoegd, maar ook hoe snel elke toevoeging plaatsvindt. Twee tijdsmetingen — pulse width (hoe lang de polymerase doet over het toevoegen van een base) en inter-pulse duration (de pauze tussen toevoegingen) — vormen een soort ritmetrack voor DNA-synthese. Door veel zorgvuldig ontworpen DNA-monsters te vergelijken, inclusief gewoon DNA, volledig Z-gesubstitueerd DNA en hybride moleculen waarin A en Z samen voorkomen, toonde het team aan dat het vervangen van A door Z subtiele maar consistente timingveranderingen veroorzaakt. Deze veranderingen hangen af van de omliggende sequentie en beïnvloeden voornamelijk de pulse width binnen een nauwe venster rond de Z-plek, terwijl de algehele sequencing-accuratesse bijna even hoog blijft als bij ongemodificeerd DNA.
Hoe Z-Calling verborgen Z-basen vindt
Voortbouwend op deze timingpatronen trainden de onderzoekers machine-learningmodellen om het kinetische “accent” van Z te herkennen. Hun hulpmiddel, Z-Calling, heeft twee hoofdtaken. Ten eerste classificeert het volledige sequencing-reads als óf gewoon DNA óf Z-bevattend DNA, zelfs in kunstmatige metagenomen die veel soorten en chemieën mengen. Dit doet het door een neuraal netwerk te gebruiken om te scoren hoe waarschijnlijk het is dat elke A-achtige positie Z is, en vervolgens de verdeling van die scores in te voeren in een support vector machine die beslist of de hele read van Z-DNA afkomstig is. Ten tweede voert het een single-letter discriminatie uit, waarbij elke positie als A of Z wordt toegewezen op basis van de lokale sequentiecontext en kinetische signalen. Over datasets van bacteriën, gist, planten, dieren en een natuurlijk Z-bevattende faag bereikten deze modellen hoge nauwkeurigheid (area-under-curve-waarden rond 0,94–0,98), vergelijkbaar met toonaangevende hulpmiddelen die gangbare DNA-methylatiemerkers detecteren.

De tool aan echte wereldtests onderwerpen
Om aan te tonen dat Z-Calling werkt buiten schone labconstructen, pasten de auteurs het toe op een gemodificeerde giststam die adenine gedeeltelijk vervangt door Z in het hele genoom. Chemische analyse gaf aan dat ruwweg een kwart van alle A-achtige posities Z was geworden. Z-Calling schatte onafhankelijk een vergelijkbaar aandeel en bracht in kaart hoe Z verspreid was over gistchromosomen en plasmiden, waarbij een grotendeels willekeurige verdeling werd onthuld. De tool scande ook gemengde datasets waarin slechts een klein deel van de reads toebehoorde aan Z-DNA-virussen of hybride genomen. Zelfs wanneer Z-bevattende reads slechts ongeveer één procent van het totaal uitmaakten, kon Z-Calling hun aanwezigheid nog met hoge zekerheid signaleren, terwijl valse alarmen uiterst zeldzaam bleven over vele controlegenomen die rijk zijn aan natuurlijke epigenetische merken.
Wat dit betekent voor de toekomst
Door subtiele timingeigenaardigheden in DNA-sequencing om te zetten in duidelijke signalen, biedt Z-Calling de eerste praktische manier om systematisch in kaart te brengen waar Z-basen voorkomen, base voor base en genoom voor genoom. Voor de algemene lezer is de kernboodschap dat ons genetische alfabet flexibeler is dan ooit gedacht, en dat we nu een manier hebben om een van de meest intrigerende alternatieve letters met hoge resolutie te lezen. Deze mogelijkheid zal wetenschappers helpen meer op Z gebaseerde virussen in de natuur op te sporen, ontworpen organismen te valideren die Z gebruiken voor extra stabiliteit of nieuwe functies, en exotische DNA-achtige polymeren te verkennen voor veilige informatieopslag en geavanceerde therapeutica. Kortom, Z-Calling verandert een obscure chemische curiositeit in een spoorbare eigenschap van echte genomen.
Bronvermelding: Wu, B., Chen, Y., Zhou, Y. et al. Z-Calling: a tool for A/Z (2,6-diaminopurine) base calling and dZ-DNA detection using PacBio HiFi reads. Commun Biol 9, 594 (2026). https://doi.org/10.1038/s42003-026-09849-8
Trefwoorden: Z-DNA, niet-canonische basen, PacBio-sequencing, machine learning genomica, fagen-genomica