Clear Sky Science · ru
Точное моделирование взаимодействий белок–белок с помощью физически-информированного геометрически инвариантного обучения
Почему партнёрства белков важны
Внутри каждой клетки белки редко действуют в одиночку. Они сталкиваются друг с другом, сцепляются, как пазлы, и образуют временные комплексы, которые контролируют сигналы, переносят грузы и борются с инфекциями. Понять, как именно два белка встречаются в трёх измерениях, позволяет выяснить механизмы заболеваний и разрабатывать новые лекарства или антитела. Экспериментальная съёмка таких молекулярных «снимков» медленна и дорога, а современные инструменты ИИ по-прежнему дают сбои при нехватке данных. В этой работе представлен ProTact — новый вычислительный подход, призванный восполнить эти пробелы.
Ограничения существующих инструментов предсказания структур
Системы вроде AlphaFold коренным образом изменили нашу способность предсказывать форму одиночных белков и некоторых комплексов. Они работают лучше всего, когда доступны многочисленные родственные последовательности, поскольку учатся на эволюционных сигналах. Однако для многих важных целей — вирусных белков, инженерных белков и антител — богатой эволюционной истории нет. В таких случаях существующие методы могут ошибаться в оценке того, как белки взаимодействуют, особенно в точных контактных точках, где атомы двух партнёров соприкасаются. Авторы утверждают, что для преодоления этих ограничений моделям нужно смотреть дальше за последовательностные паттерны и уделять больше внимания физической форме и подгонке поверхностей белков.
Новый способ чтения поверхностей белков
ProTact рассматривает каждый белок как сеть остатков, связанных в пространстве, и фокусируется на том, как их внешние поверхности взаимодополняют друг друга. В нём используется геометрический кодировщик, специально спроектированный так, чтобы повороты или сдвиги белка в пространстве не меняли внутреннего представления. Второй модуль применяет правила, вдохновлённые тригонометрией, для рассуждений о треугольниках, образуемых группами остатков, помогая модели улавливать многотельные эффекты, а не только попарные контакты. Вместе эти компоненты создают карту, выделяющую остатки двух белков, которые, вероятно, будут контактировать при образовании комплекса. ProTact может работать с высококачественными экспериментальными структурами или с формами, предсказанными другими инструментами, и использовать информацию о последовательности, когда она доступна, без зависимости от неё.

Насколько хорошо работает метод
Исследователи протестировали ProTact на нескольких стандартных коллекциях пар белков, включая сложные случаи из общественных оценочных экспериментов. Во всех этих бенчмарках ProTact последовательно точнее определял контактные остатки по сравнению с ведущими методами, основанными на последовательностях и структурах. Например, он улучшил распространённую метрику точности примерно на треть по сравнению с лучшим существующим подходом на двух широко используемых наборах данных. Даже когда входные структуры поступали от AlphaFold, а не из эксперимента, и содержали шум, ProTact оставался точнее конкурентов. Метод также справился с большой «слепой» проверкой недавно решённых пар белков, показав высокую эффективность как для симметричных, так и для асимметричных комплексов.
От карт контактов к полным комплексам
Предсказание того, какие остатки соприкасаются, — лишь часть задачи; учёным также нужен полный трёхмерный расклад партнёров. Карты контактов ProTact можно преобразовать в докинговые позы, то есть полные модели того, как два белка располагаются вместе. С использованием стандартного алгоритма выравнивания авторы показывают, что предложенные ProTact позы ближе к экспериментально определённым комплексам, чем позы от других методов, основанных на контактах. Добавление этих предсказаний контактов в виде ограничений к существующим докинговым программам повышает их точность для большинства протестированных пар. ProTact также может перенастраивать ранжирование кандидатных комплексов, сгенерированных AlphaFold3, ближе согласуя их с экспериментальными оценками качества и улучшая результаты для нескольких примеров антител–антигенов, где данных о последовательностях мало.

Последствия для антител и разработки лекарств
Антитела представляют собой особенно сложную задачу, потому что их петли связывания могут сильно варьировать и часто лишены выраженных эволюционных сигналов. Сначала обучив ProTact на большой общей выборке, а затем донастроив на комплексах антител–антигенов, авторы демонстрируют улучшение предсказания контактов и качества докинга по сравнению с другими специализированными инструментами. В кейс-стади антитела, нацеленном на вирус SARS-CoV-2, ProTact сгенерировал значительно более точный комплекс, чем конкурирующие методы, даже при ограниченной информации о последовательности. Это указывает на то, что детальное геометрическое рассуждение о поверхностях частично компенсирует отсутствие эволюционных подсказок.
Что означает эта работа в перспективе
Для неспециалиста главный вывод в том, что ProTact учится «чувствовать», как две поверхности белков подгоняются друг к другу, а не полагается главным образом на длинные эволюционные ряды. Вплетая физические идеи о дополняемости формы в современную нейронную сеть, он даёт более надёжные предположения о местах соприкосновения белков и их сборке в комплексы. Хотя метод по-прежнему зависит от качества исходных структур и испытывает трудности при значительных конформационных изменениях белков, ProTact представляет собой мощный новый инструмент для картирования белковых партнёрств, особенно в условиях недостатка данных. Это может ускорить фундаментальные исследования клеточных машин и поддержать разработку новых терапевтических средств, нацеленных на изменение белковых взаимодействий.
Цитирование: Rao, J., Liu, D., Zhou, X. et al. Accurate protein-protein interactions modeling through physics-informed geometric invariant learning. Commun Biol 9, 685 (2026). https://doi.org/10.1038/s42003-026-09809-2
Ключевые слова: взаимодействия белок–белок, предсказание структуры, докинг, AlphaFold, связывание антител