Clear Sky Science · ru

Оценка стабильности сворачивания белков с явным учётом развёрнутых состояний

· Назад к списку

Почему стабильность белков важна

Каждый белок в вашем организме — это крошечный молекулярный механизм, который должен свернуться в точную трёхмерную форму, чтобы правильно выполнять свою функцию. Если эта складка слишком хрупка, белок может работать неправильно, слипаться или вовсе не синтезироваться — проблемы, связанные с заболеваниями и с неудачами при создании лекарств и ферментов на основе белков. Измерять стабильность белка в лаборатории медленно и сложно, поэтому учёные ищут компьютерные методы, которые могли бы надёжно сказать по одной лишь последовательности, насколько легко белок будет разворачиваться.

Новый взгляд на свернутые и развёрнутые белки

Большинство современных алгоритмов сосредоточено почти исключительно на свернутой форме белка. Они часто начинают с предсказанной ИИ структуры, например из AlphaFold, и рассматривают эту единственную структуру как главный фактор стабильности. Но на самом деле стабильность — это энергетический зазор между двумя широкими ансамблями: компактным свернутым состоянием и множеством гибких форм, составляющих развёрнутое состояние. Авторы утверждают, что игнорирование развёрнутой стороны этого равновесия — ключевая причина, по которой существующие инструменты не могут точно соответствовать экспериментальным измерениям свободной энергии сворачивания, известной как ΔG.

Figure 1
Figure 1.

Новая модель, обучающаяся обоим состояниям

Исследователи представляют IFUM, систему глубокого обучения, разработанную для оценки ΔG, одновременно изучающую баланс свернутых и развёрнутых состояний для каждого белка. Вместо того чтобы считать развёрнутое состояние смутным фоном, IFUM использует идеи из физики полимеров и представляет его как «случайную катушку», кодируя и свернутое, и развёрнутое состояния в виде карт расстояний между парами аминокислот. Модель принимает данные от мощных предварительно обученных сетей для последовательностей и структур, а затем совместно предсказывает общую стабильность и карту вероятностей, описывающую, какая часть популяции белка является свернутой или развёрнутой для каждой пары остатков. Обучение на очень большой базе небольших экспериментально охарактеризованных белков и известных разупорядоченных белков помогает IFUM распознавать как хорошо структурированные, так и гибкие последовательности.

Лучшие показатели и более широкий охват мутаций

При тестировании на тщательно контролируемом наборе небольших белков IFUM предсказывает экспериментальные значения ΔG с меньшей ошибкой и более высокой корреляцией, чем предыдущие методы на базе ИИ, опирающиеся только на свернутую структуру или на языковые модели, обученные на последовательностях. Важным преимуществом является то, что модель также справляется с широким спектром изменений последовательности. Она точно отражает эффекты одно- и двухточечных мутаций, а также вставок и делеций, меняющих длину белка — ситуаций, в которых многие существующие инструменты либо полностью отказывают, либо изначально не были рассчитаны на такую задачу. Внутреннее сопоставление показывает, что исключение цели, связанной с развёрнутым состоянием, заметно ухудшает результаты, что подчёркивает: явное моделирование ансамбля развёрнутых состояний — это не просто концептуальная деталь, а центральный элемент точности предсказаний.

Figure 2
Figure 2.

От лабораторного дизайна к реальным испытаниям

Чтобы проверить, может ли IFUM помочь в реальной инженерии белков, авторы применили его к трем сложным задачам дизайна: стабилизации интерферона‑лямбда, перестройке иммунного сигнального белка IL‑10 и улучшению фермента по модификации сахаров UGT76G1. Во всех трёх случаях предсказанная IFUM стабильность хорошо коррелировала с измеренными температурами плавления, которые показывают, сколько тепла белок выдерживает до разворачивания. Модель также помогла отсеять сотни совершенно новых, созданных компьютером белков, выбирая те, которые с наибольшей вероятностью свернутся и останутся растворимыми в клетках, превосходя широко используемые показатели уверенности от сетей предсказания структуры. Эти результаты указывают на то, что IFUM может использоваться как практический «фильтр стабильности» наряду с проверками на основе структуры в современных рабочих процессах по дизайну белков.

Ограничения и направления развития

Как и любая модель, IFUM имеет границы применимости. Она обучена главным образом на коротких, одноцепочечных, растворимых белках, и её абсолютные численные оценки стабильности становятся менее надёжными для значительно более крупных белков или белков с обширными гибкими петлями или мембранными участками. Описание развёрнутого состояния по‑прежнему представляет собой упрощённую статистическую модель, а не полностью реалистичную картину всех возможных форм. Тем не менее подход демонстрирует, что обучение ИИ учитывать оба ансамбля — свернутый и развёрнутый — даёт более надёжные оценки стабильности. Для неспециалистов главный вывод таков: IFUM приближает нас к возможности с количественной уверенностью спросить у компьютера «Удержится ли этот дизайн белка?», что потенциально ускорит разработку более безопасных биологических лекарств и более устойчивых промышленных ферментов.

Цитирование: Lee, H., Cho, Y., Yun, J. et al. Protein folding stability estimation with explicit consideration of unfolded states. Nat Commun 17, 1883 (2026). https://doi.org/10.1038/s41467-026-68637-4

Ключевые слова: стабильность белка, сворачивание белков, глубокое обучение, дизайн белков, мутации