Clear Sky Science · ru
NuConf: библиотека ротамеров для ДНК и РНК и её внедрение в программу проектирования белков MUMBO
Почему важно моделировать форму ДНК и РНК на компьютере
Проектирование новых белков с помощью компьютерных инструментов сделало большой шаг вперёд за последние годы, но ДНК и РНК в значительной степени остались позади. Их структуры фиксированы реже, что затрудняет обучение искусственного интеллекта тому, как они изгибаются, вращаются и взаимодействуют с белками. В этом исследовании представлен NuConf — новый способ представления форм строительных блоков ДНК и РНК, благодаря которому существующее программное обеспечение для проектирования белков может также проектировать нуклеиновые кислоты и их контактные поверхности с белками. 
Как обычно проектировщики работают с гибкими боковыми частями
Когда учёные проектируют белки на компьютере, они не перебирают каждое возможное колебание каждой боковой цепи атом за атомом. Вместо этого используют «ротамерные библиотеки» — коллекции распространённых форм боковых цепей, выведённые из тысяч известных структур. Программы вроде MUMBO размещают эти формы на фиксированном белковом остове и с помощью энергетических расчётов выбирают наилучшее сочетание. До сих пор сравнимая, практичная библиотека для боковых частей оснований ДНК и РНК отсутствовала, особенно такая, которая позволяла бы одной и той же программе одинаково обрабатывать белки, ДНК и РНК.
Картирование предпочтительных форм ДНК и РНК
Авторы начали с анализа более чем 175 000 нуклеотидов, взятых из кристаллических структур высокого качества ДНК, РНК и их комплексов с белками. Для каждого нуклеотида они измерили два ключевых угла: один описывающий прогиб сахарного кольца остова, другой — ориентацию присоединённого основания относительно этого сахара. Они обнаружили, что сахара предпочитают два широких семейства форм — одно более характерно для ДНК, другое для РНК — и что эти формы сахара тесно связаны с ориентацией основания. Иными словами, поза остова и направление основания не независимы; они меняются согласованно в характерных сочетаниях.
Преобразование структурных закономерностей в практическую библиотеку
Чтобы превратить эти закономерности в инструмент, пригодный для программы проектирования, команда применила статистические модели, которые разбивают сложные распределения углов на небольшой набор отдельных пиков, где каждый пик представляет часто используемую ориентацию основания. Для каждого типа основания в ДНК и РНК и для каждой широкой формы сахара они определили от трёх до шести предпочтительных ориентаций с указанием их частот встречаемости. Эта коллекция, названная NuConf, выступает как «каталог форм» нуклеозидов, привязанный к локальной позе остова. Авторы также создали упрощённую резервную версию с меньшим числом форм, которая жертвует детализацией ради меньших вычислительных затрат. 
Проверка, действительно ли новые формы работают
Затем исследователи внедрили эти формы в MUMBO и задали две задачи: сможет ли программа при фиксированном остове восстановить исходные положения оснований, наблюдаемые в реальных структурах, и сможет ли она выбирать подходящие формы и последовательности, опираясь только на энергетические оценки, без подсказок? В больших тестовых наборах, содержащих десятки тысяч нуклеотидов, библиотека NuConf воспроизводила положения оснований с точностью, сопоставимой и иногда превосходящей стандартные библиотеки, используемые для боковых цепей белков. Когда программе приходилось выбирать формы только по энергии, NuConf всё равно превосходила упрощённую библиотеку и конкурирующие инструменты для нуклеиновых кислот, одновременно корректно воспроизводя ключевые контакты спаривания и стаккинга как в свободных нуклеиновых кислотах, так и в комплексах белок–нуклеиновая кислота.
Что это значит для будущего молекулярного проектирования
Для неспециалистов главный вывод таков: авторы дали проектированию при помощи компьютера новый, общий язык для белков и нуклеиновых кислот. NuConf позволяет существующему программному обеспечению для проектирования белков надёжно размещать и выбирать основания ДНК и РНК вдоль заданного остова и в местах контакта с белком. Это не заменяет современные методы ИИ, но заполняет важный пробел, когда данных для обучения мало или когда требуется оценка тонких физических взаимодействий. В долгосрочной перспективе такой инструмент может помочь исследователям проектировать более точные регуляторы генов, РНК‑переключатели и гибридные белково‑нуклеиновые машины полностью в виртуальной среде до их создания в лаборатории.
Цитирование: Makarova, M.O., Stiebritz, M.T., Basturk, D. et al. NuConf: a rotamer library for DNA and RNA and its implementation in the protein design software MUMBO. Sci Rep 16, 16281 (2026). https://doi.org/10.1038/s41598-026-52380-3
Ключевые слова: проектирование нуклеиновых кислот, ротамерная библиотека, взаимодействия белок–ДНК, моделирование РНК, вычислительная структурная биология