Clear Sky Science · ru
Разделение коэволюционных ограничений для моделирования конформационной гетерогенности белков
Белки как меняющие форму машины
Белки — это крошечные машины, которые обеспечивают жизнь, и многие из них функционируют за счёт тонких изменений формы. Эти сдвиги могут включать включение или выключение сигналов, открытие или закрытие молекулярных ворот или изменение форм карманов для связывания, на которые нацелены препараты. Тем не менее большинство компьютерных инструментов по‑прежнему пытаются назначить каждому белку одну «правильную» структуру, скрывая ту самую гибкость, лежащую в основе здоровья и болезней. В этой статье представлен EvoSplit — новый способ считывать эволюционную запись, зашифрованную в белковых последовательностях, чтобы обнаружить несколько функционально важных форм — включая некоторые, которые никогда не были видны в экспериментах и могут открыть новые пути для разработки лекарств.

Почему гибкость белков важна для медицины
Внутри наших клеток белки редко сидят неподвижно. Они сгибаются, вращаются и иногда даже перекладывают участки своей структуры в ответ на изменения температуры, кислотности, партнёров по связыванию или химических модификаций. Эти движения могут быть небольшими, например сдвиг нескольких боковых цепей, или драматичными, когда целые секции превращаются из спирали в лист. Такие изменения лежат в основе того, как рецепторы распознают гормоны, как транспортеры перемещают молекулы через мембраны и как онкопротеинки приводят к развитию рака. Если мы знаем только один снимок белка, мы можем пропустить активную форму, доступный для лекарств карман или конформацию, ведущую к болезни. Поэтому точное «кастинг‑лист» устойчивых форм белка имеет решающее значение для понимания биологии и разработки целевых терапий.
Чтение скрытых заметок эволюции
За миллионы лет белковые последовательности эволюционировали под давлением сохранения не только одной структуры, но часто нескольких биологически значимых форм. Когда две аминокислоты склонны мутировать координированно в родственных белках, это указывает на то, что они должны оставаться в контакте по крайней мере в одной конформации. Современные системы глубокого обучения, такие как AlphaFold2, преуспевают потому, что они извлекают такие коэволюционные паттерны из больших семейств родственных последовательностей, известных как множественные выравнивания последовательностей (MSA). Однако когда белок может принимать более одного фолда, сигналы для разных состояний смешиваются, и стандартные подходы обычно сводят их в одну усреднённую структуру. Ранние методы пытались разделять это путём кластеризации последовательностей на основе их общей похожести, но такие подходы в значительной мере игнорировали попарные паттерны, которые на самом деле кодируют предпочтения структуры.
Как EvoSplit расслаивает перекрывающиеся формы
Авторы опираются на модель белкового языка под названием MSA Transformer, которая использует механизм внимания, чтобы научиться тому, какие остатки в каких последовательностях «обращают внимание» друг на друга. Они показывают, что для белков с несколькими известными структурами паттерн внимания каждой отдельной последовательности, как правило, похож больше на карту контактов одной конкретной конформации, чем на другую. Иными словами, каждая последовательность несёт отпечаток своей «любимой» формы. EvoSplit использует это, применяя матрицы внимания — а не сырую последовательную похожесть — в качестве признаков для кластеризации выравнивания на подгруппы. Каждая кластерная группа затем отдельно подаётся в AlphaFold2, по сути давая предиктору структуры более чистый эволюционно‑специфичный подсказ. На наборе из 85 белков, известных своим переключением фолда, EvoSplit даёт модели, которые лучше согласуются с экспериментальными структурами и имеют более высокую уверенность по сравнению с ведущим методом кластеризации на основе последовательности, особенно для реже представленного состояния.
Поиск новых состояний вне тренировочных данных
Ключевая обеспокоенность в отношении мощных нейронных сетей состоит в том, что они могут просто «запоминать» структуры из наборов обучения, а не открывать новые. Чтобы проверить, действительно ли EvoSplit добавляет информацию, авторы обратились к набору транспортеров и рецепторов, альтернативные состояния которых не были включены в исходное обучение AlphaFold2. Даже в этом случае EvoSplit восстанавливает как внутрь‑, так и наружно‑ориентированные формы, а также отличающиеся активные и неактивные конформации с высокой структурной схожестью с экспериментальными моделями. Метод также масштабируется до более исследовательских задач: применённый к более чем сотне белков, связанных с раком человека, он выделяет 54 кандидата, вероятно способных принимать несколько конформаций. Для некоторых из них, например киназы LCK и регулятора клеточного цикла циклина D1, EvoSplit предлагает правдоподобные расположения доменов, которые отзываются известными структурами родственных белков, намекая на невидимые, но биофизически правдоподобные состояния.

Удивительный новый фолд в переключателях, связанных с раком
Возможно, самый интригующий результат касается маленьких GTPаз, таких как HRAS и KRAS, классических молекулярных переключателей, часто мутирующих в опухолях. Обычно эти белки переключаются между «включено» и «выключено» посредством тонких перестановок вблизи нуклеотидсвязывающего участка, при этом остальная часть фолда остаётся нетронутой. Однако EvoSplit неоднократно предсказывает альтернативную конформацию, в которой одна спираль вблизи начала белка превращается в лист, изменяя общую топологию. Этот паттерн наблюдается у пяти родственных GTPаз, что указывает на то, что это не случайность. Моделирование этой необычной формы остаётся стабильным в течение сотен наносекунд, а анализы эволюционных связей показывают отличительные сигналы контактов, соответствующие её уникальным листовым контактам. Когда авторы моделируют взаимодействия HRAS с несколькими известными партнёрами, и классическая, и новая конформация образуют стабильные комплексы, но с сдвинутыми интерфейсами контактов, что подразумевает, что альтернативный фолд может поддерживать иные сигнальные поведения.
Что это означает для будущей разработки лекарств
Для неспециалиста основная мысль такова: в наших белках может скрываться больше форм — а значит и больше функциональных возможностей —, чем выявляло традиционное предсказание структур. EvoSplit использует эволюционно направленное распознавание паттернов, чтобы отделять эти скрытые состояния, вместо того чтобы усреднять их. Побеждая ранние методы на известных переключающихся по фолду белках, обнаруживая альтернативные состояния в хорошо изученных рецепторах и транспортёрах и предлагая новый, стабильный фолд для связанных с раком переключателей, таких как HRAS, эта работа доказывает, что многосостояночное моделирование должно стать рутинной практикой. В практическом плане более богатые структурные каталоги могут выявить новые карманы для лекарств, объяснить, почему определённые мутации вредны, и указать на пути, которые становятся заметными только когда мы смотрим дальше одного статического снимка структуры.
Цитирование: Li, S., Zhang, C., Kong, L. et al. Disentangling coevolutionary constraints for modeling protein conformational heterogeneity. Commun Chem 9, 146 (2026). https://doi.org/10.1038/s42004-026-01940-9
Ключевые слова: конформационная динамика белков, коэволюционные сигналы, AlphaFold2, белки, связанные с раком, переключение фолда GTPase