Clear Sky Science · sv
Z-Calling: ett verktyg för A/Z (2,6-diaminopurin) basavläsning och dZ-DNA-detektion med PacBio HiFi-avläsningar
Varför en ny sorts DNA spelar roll
DNA beskrivs ofta som livets universella ritning, uppbyggd av fyra välkända bokstäver: A, T, C och G. Men vissa virus bryter tyst detta mönster och byter ut bokstaven A mot en kemisk kusin kallad Z som gör deras DNA starkare och svårare att angripa. Denna upptäckt antyder ett dolt lager av genetisk mångfald med stora konsekvenser för bioteknik, medicin och till och med datalagring. Utmaningen har varit lätt att formulera men svår att lösa: hur kan forskare pålitligt hitta och kartlägga detta ovanliga Z-DNA, särskilt när det blandas med vanligt DNA? Den här studien introducerar Z-Calling, ett beräkningsverktyg som äntligen gör det möjligt med befintlig långläsande sekvenseringsteknik.

En märklig bokstav i det genetiska alfabetet
I de flesta organismer parar basen adenin (A) med tymin (T) via två vätebindningar, vilket hjälper till att stabilisera den klassiska DNA-dubbelspiralen. Vissa bakteriofager — virus som infekterar bakterier — har utvecklats för att ersätta A med 2,6-diaminopurin, kallad Z. Z bildar tre vätebindningar med T, vilket gör DNA-spiralen mer stabil och förändrar dess fysiska beteende. Denna ovanliga kemi kan ge Z-innehållande virus fördelar mot värdarnas försvar och öppnar möjligheter för designade molekyler med bättre egenskaper. Forskare har visat att Z kan skärpa genetiska tester, finjustera CRISPR-genterapi och minska immunreaktioner mot experimentella RNA-läkemedel. Utan ett sätt att exakt lokalisera var Z sitter i en DNA-sträng har det dock varit svårt att fullt ut förstå eller utnyttja dessa fördelar.
Dagens verktyg räcker inte
Standardmetoder för DNA-sekvensering utgår från att alla A-liknande signaler verkligen är A, så de tenderar att misstolka Z som vanlig adenin. Kemiska metoder som högpresterande vätskekromatografi kan upptäcka hur mycket Z som finns i bulk, men de kan inte ange var varje Z finns längs ett genom, särskilt inte i komplexa miljöprover som innehåller många arter. Vissa tredjepersonssekvenseringsplattformar, som nanopore-enheter, är teoretiskt känsliga nog att skilja på baser, men i praktiken kan deras signaler vara brusiga och svåra att tolka när främmande kemi förekommer. Fram tills nu har det saknats ett bekvämt och pålitligt sätt att skanna komplexa DNA-blandningar och tydligt skilja normalt DNA från Z-innehållande DNA, eller att skilja A från Z bokstav för bokstav.
Lyssna på rytmen i DNA-syntesen
Författarna fokuserade på PacBio Circular Consensus Sequencing, en teknik som upprepade gånger kopierar samma DNA-molekyl och registrerar inte bara vilken bas som läggs till utan också hur snabbt varje tillsättning sker. Två tidsmått — pulsbredd (hur länge polymeraset spenderar på att lägga till en bas) och inter-pulse duration (pausen mellan tillsatser) — bildar en sorts rytmspår för DNA-syntes. Genom att jämföra många noggrant designade DNA-prover, inklusive vanligt DNA, fullt Z-substituerat DNA och hybridmolekyler där A och Z samexisterar, visade teamet att utbyte av A mot Z skapar subtila men konsekventa tidsmässiga förändringar. Dessa förändringar beror på den omgivande sekvensen och påverkar främst pulsbredd inom ett smalt fönster runt Z-platsen, samtidigt som den övergripande sekvenseringsnoggrannheten förblir nästan lika hög som för omodifierat DNA.
Hur Z-Calling hittar dolda Z-baser
Byggt på dessa kinetiska mönster tränade forskarna maskininlärningsmodeller för att känna igen Z:s ”betoning”. Deras verktyg, Z-Calling, har två huvudsakliga uppgifter. För det första klassificerar det hela sekvenseringsläsningar som antingen vanligt DNA eller Z-innehållande DNA, även i artificiella metagenom som blandar många arter och kemier. Det gör detta genom att använda ett neuralt nätverk för att poängsätta hur sannolikt varje A-liknande position är Z, och sedan mata fördelningen av dessa poäng in i en supportvektormaskin som avgör om hela läsningen kommer från Z-DNA. För det andra utför det en enstaka-bokstavs-diskriminering, där varje position tilldelas A eller Z baserat på dess lokala sekvenskontext och kinetiska signaler. Över dataset från bakterier, jäst, växter, djur och en naturligt Z-innehållande fag nådde dessa modeller hög noggrannhet (arean under kurvan värden runt 0,94–0,98), liknande ledande verktyg som upptäcker vanliga DNA-metylmärken.

Sätta verktyget på verkliga tester
För att visa att Z-Calling fungerar utanför rena labsammanställningar tillämpade författarna det på en konstruerad jäststam som delvis ersätter adenin med Z över hela sitt genom. Kemisk analys indikerade att ungefär en fjärdedel av alla A-liknande positioner hade blivit Z. Z-Calling uppskattade oberoende en liknande andel och kartlade hur Z var utspritt över jästkromosomer och plasmider, vilket avslöjade en i stort sett slumpmässig fördelning. Verktyget genomsökte också blandade dataset där endast en mycket liten andel läsningar tillhörde Z-DNA-virus eller hybridgenom. Även när Z-innehållande läsningar utgjorde så lite som cirka en procent av totalen kunde Z-Calling fortfarande upptäcka deras förekomst med hög säkerhet, samtidigt som falsklarm förblev extremt ovanliga över många kontrollgenom rika på naturliga epigenetiska märken.
Vad detta betyder för framtiden
Genom att förvandla subtila tidsmässiga avvikelser i DNA-sekvensering till tydliga signaler ger Z-Calling det första praktiska sättet att systematiskt kartlägga var Z-baser förekommer, bokstav för bokstav och genom för genom. För en allmän läsare är huvudbudskapet att vårt genetiska alfabet är mer flexibelt än man tidigare trott, och att vi nu har ett sätt att läsa en av dess mest fascinerande alternativa bokstäver med hög upplösning. Denna förmåga kommer att hjälpa forskare att leta efter fler Z-baserade virus i naturen, validera konstruerade organismer som använder Z för ökad stabilitet eller nya funktioner, och utforska exotiska DNA-liknande polymerer för säker informationslagring och avancerade terapier. Kort sagt omvandlar Z-Calling en obskyr kemisk kuriositet till en spårbar egenskap i verkliga genom.
Citering: Wu, B., Chen, Y., Zhou, Y. et al. Z-Calling: a tool for A/Z (2,6-diaminopurine) base calling and dZ-DNA detection using PacBio HiFi reads. Commun Biol 9, 594 (2026). https://doi.org/10.1038/s42003-026-09849-8
Nyckelord: Z-DNA, icke-kanoniska baser, PacBio-sekvensering, maskininlärning genomi, faggenomik