Clear Sky Science · nl

NuConf: een rotamerbibliotheek voor DNA en RNA en de implementatie ervan in de eiwitontwerpsoftware MUMBO

· Terug naar het overzicht

Waarom het virtueel hervormen van DNA en RNA ertoe doet

Het ontwerpen van nieuwe eiwitten met computertools heeft de laatste jaren grote sprongen gemaakt, maar DNA en RNA zijn grotendeels achtergebleven. De structuren van deze genetische moleculen zijn minder uitgebreid gedocumenteerd, wat het moeilijk maakt voor kunstmatige intelligentie om te leren hoe ze buigen, draaien en met eiwitten interageren. Deze studie introduceert NuConf, een nieuwe manier om de vormen van DNA- en RNA-bouwstenen te representeren zodat bestaande eiwitontwerpsoftware ook nucleïnezuren en hun contactvlakken met eiwitten kan ontwerpen.

Figure 1. Ontwerpsoftware gebruikt een nieuwe catalogus van vormen om DNA, RNA en eiwitten samen te ontwerpen op een gedeelde structurele ruggegraat.
Figure 1. Ontwerpsoftware gebruikt een nieuwe catalogus van vormen om DNA, RNA en eiwitten samen te ontwerpen op een gedeelde structurele ruggegraat.

Hoe ontwerpers doorgaans omgaan met flexibele zijgroepen

Wanneer wetenschappers eiwitten op een computer ontwerpen, onderzoeken ze niet elke mogelijke beweging van elke zijketen atomair. In plaats daarvan gebruiken ze “rotamerbibliotheken”, verzamelingen van veelvoorkomende zijketenvormen afgeleid uit duizenden bekende structuren. Programma’s zoals MUMBO plaatsen deze vormen op een vaste eiwitruggegraat en gebruiken energie-berekeningen om te beslissen welke combinatie het beste past. Tot nu toe ontbrak een vergelijkbare, praktische bibliotheek voor de zijdelen van DNA- en RNA-bases, vooral een die hetzelfde programma eiwitten, DNA en RNA op gelijke voet zou laten behandelen.

De favoriete vormen van DNA en RNA in kaart brengen

De auteurs begonnen met het onderzoeken van meer dan 175.000 nucleotiden afkomstig uit kristalstructuren van hoge kwaliteit van DNA, RNA en hun complexen met eiwitten. Voor elk nucleotide maten ze twee sleutelhoeken: één die vastlegt hoe de suikerring van de ruggegraat puckervorming vertoont, en één die beschrijft hoe de gebonden base is geroteerd ten opzichte van die suiker. Ze vonden dat suikers twee brede families van vormen prefereren, één meer typisch voor DNA en één voor RNA, en dat deze suikerhoudingen sterk gekoppeld zijn aan de oriëntatie van de base. Met andere woorden, de ruggegraatstand en baseoriëntatie zijn niet onafhankelijk; ze bewegen in karakteristieke samenhangen.

Structurele patronen omzetten in een praktische bibliotheek

Om deze patronen om te zetten in iets dat een ontwerpprogramma kan gebruiken, paste het team statistische modellen toe die complexe hoekverdelingen ontleden in een klein aantal afzonderlijke pieken, waarbij elke piek een veelgebruikte baseoriëntatie voorstelt. Voor elk type base in DNA en RNA, en voor elke brede suikervorm, definieerden ze drie tot zes voorkeursoriëntaties, samen met hoe vaak elk voorkomt. Deze verzameling, NuConf genoemd, fungeert als een nucleoside "vormcatalogus" gekoppeld aan de lokale ruggegraatstand. Ze maakten ook een eenvoudigere back-upversie met minder vormen, die enige detailuitwisseling geeft voor lagere rekencosts.

Figure 2. Voorkeursvormen van DNA- en RNA-bases worden gekozen langs een vaste ruggegraat zodat ze het beste passen en interactie aangaan met een nabijliggend eiwitoppervlak.
Figure 2. Voorkeursvormen van DNA- en RNA-bases worden gekozen langs een vaste ruggegraat zodat ze het beste passen en interactie aangaan met een nabijliggend eiwitoppervlak.

Testen of de nieuwe vormen daadwerkelijk werken

De onderzoekers bouwden deze vormen vervolgens in MUMBO en stelden twee vragen: kon het programma, gegeven een vaste ruggegraat, de oorspronkelijke baseposities uit echte structuren reconstrueren, en kon het goede vormen en sequenties kiezen alleen op basis van energiescores, zonder het antwoord te krijgen? In grote testsets met tienduizenden nucleotiden reproduceerde de NuConf-bibliotheek baseposities met een nauwkeurigheid vergelijkbaar met, en soms beter dan, die van standaardbibliotheken die voor eiwitzijketens worden gebruikt. Wanneer het programma vormen puur op energie moest kiezen, presteerde NuConf nog steeds beter dan een eenvoudigere bibliotheek en concurrerende nucleïnezurenhulpmiddelen, terwijl het belangrijke base‑paarings- en stapelingscontacten vastlegde in zowel vrije nucleïnezuren als eiwit‑nucleïnezuurcomplexen.

Wat dit betekent voor toekomstig moleculair ontwerp

Voor niet‑specialisten is de belangrijkste conclusie dat de auteurs de computerondersteunde ontwerppijplijn een nieuwe, gedeelde taal hebben gegeven voor zowel eiwitten als nucleïnezuren. NuConf stelt bestaande eiwitontwerpsoftware in staat DNA- en RNA-bases betrouwbaar te plaatsen en te kiezen langs een gegeven ruggegraat en op eiwitcontactplaatsen. Dit vervangt moderne AI-methoden niet, maar het vult een belangrijk gat wanneer trainingsdata schaars zijn of wanneer fijnmazige fysieke interacties beoordeeld moeten worden. Op de lange termijn kan dit soort hulpmiddel onderzoekers helpen preciezere genregulatoren, RNA-schakelaars en hybride eiwit‑nucleïnezuurmachines volledig in silico te ontwerpen voordat ze in het laboratorium worden gebouwd.

Bronvermelding: Makarova, M.O., Stiebritz, M.T., Basturk, D. et al. NuConf: a rotamer library for DNA and RNA and its implementation in the protein design software MUMBO. Sci Rep 16, 16281 (2026). https://doi.org/10.1038/s41598-026-52380-3

Trefwoorden: ontwerp van nucleïnezuren, rotamerbibliotheek, eiwit–DNA-interacties, RNA-modellering, computationele structurele biologie