Clear Sky Science · ru

Расшифровка закономерностей карманов DEL с помощью контрастного обучения

· Назад к списку

Почему изучение «карманов» белков может ускорить создание новых лекарств

Современные искатели лекарств теперь могут одновременно проверять триллионы маленьких молекул с помощью ДНК-кодированных библиотек (DEL). Тем не менее лишь немногие молекулы, полученные из DEL, превратились в реальные лекарства. Одним из крупных пробелов является понимание того, какие белки в организме на самом деле имеют подходящие ниши — «карманы» — чтобы молекулы из DEL могли к ним прикрепляться. В этом исследовании этот разрыв восполняют: авторы сопоставляют, какими бывают успешные DEL-карманы, и создают модель искусственного интеллекта под названием ErePOC, чтобы искать похожие карманы по всему человеческому организму.

Как технология DEL ищет новые лекарственные молекулы

DEL работает немного как снасти с штрихкодированными приманками. Химики присоединяют небольшие кандидатные молекулы к коротким фрагментам ДНК, которые служат идентификационными метками, а затем подвергают обширные смеси таких промаркированных молекул воздействию исследуемого белка. Молекулы, которые прикрепляются, читают путем секвенирования ДНК. Этот подход быстрый и недорогой, но перевод результатов DEL в реальные лекарства остается сложным. Одна из причин — то, что молекулы DEL имеют определенные химические ограничения, например, способы их синтеза в воде и способ присоединения ДНК-метки. Эти ограничения заставляют их предпочитать определенные типы белковых карманов, но до сих пор эти предпочтения не были систематически картированы.

Figure 1
Figure 1.

Что делает карман привлекательным для молекул DEL

Авторы сначала сравнили тысячи белковых карманов, которые связывают разные типы лигандов: обычные биологические малые молекулы, одобренные FDA лекарства и хиты DEL. Они обнаружили, что карманы, связанные с DEL и лекарствами, как правило, крупнее и химически более сложны, чем карманы для природных лигандов. В частности, DEL-карманы более открытые и гидрофобные — то есть они благоприятствуют «жировым», водоотталкивающим взаимодействиям — при этом содержат небольшой, но важный набор полярных контактных точек, которые тонко настраивают связывание. Некоторые громоздкие аминокислоты, обеспечивающие ароматические и гидрофобные поверхности, такие как тирозин и фенилаланин, встречаются в карманах, связывающих DEL и лекарства, чаще, чем на типичных поверхностях белков. В целом DEL-карманы больше походит на классические лекарственно-ориентированные карманы, чем на обычные метаболические сайты, но с дополнительным смещением в сторону больших гидрофобных полостей.

Обучение модели ИИ распознавать «характер» карманов

Чтобы пойти дальше простых подсчетов размеров и химии, команда создала ErePOC — модель представления, которая рассматривает каждый связывающий карман как нечто вроде отпечатка. Она стартует от встраиваний языковой модели для белков, которые улавливают закономерности, выученные на миллионах последовательностей, и сжимает информацию о резидуах, образующих карман, в компактный числовой вектор. С помощью контрастного обучения ErePOC обучают так, чтобы карманы, связывающие химически похожие лиганды, оказывались близко друг к другу в этом абстрактном пространстве, а карманы, связывающие очень разные молекулы, отдалялись. Когда авторы визуализировали это пространство, карманы, известные связывать одинаковые кофакторы, такие как АТФ или гем, образовали четко отделенные кластеры, что показывает: модель научилась группировать карманы по функциональному поведению, а не только по общей форме белка.

Поиск целевых участков, благоприятных для DEL, во всем человеческом протеоме

После обучения ErePOC исследователи спроецировали известные DEL-карманы, карманы лекарств и сотни тысяч карманов из экспериментальных и предсказанных структур белков в одно и то же ландшафтное пространство. DEL-карманы распределились широко, что указывает на то, что скрининг DEL по сути может охватить большую часть традиционного «лекарственно-адекватного» пространства, но при этом они все же показывали явные предпочтения к определенным регионам, связанным с большими гидрофобными карманами. Команда затем просканировала более 23 000 предсказанных AlphaFold человеческих белков, отбирая хорошо определенные карманы и выясняя, какие из них наиболее похожи на известные DEL-карманы в пространстве ErePOC. Они идентифицировали почти 2 800 человеческих белков с карманами, высоко схожими с успешными DEL-сайтами, с сильным обогащением в семьях таких ферментов, как трансферазы, гидролазы, окислоредуктазы, регуляторы хроматина и некоторые РНК‑связывающие белки. Дальнейшее компьютерное докинг‑моделирование с большой виртуальной DEL показало, что помеченные ErePOC карманы действительно склонны более благоприятно связывать молекулы, похожие на DEL.

Figure 2
Figure 2.

Почему это важно для будущего поиска лекарств

Для неспециалистов основной вывод заключается в том, что успех ультра‑больших химических библиотек зависит не меньше от выбора правильных белковых карманов, чем от самих молекул. Эта работа показывает, что хиты DEL, как правило, приходят из карманов, которые большие, гибкие и гидрофобные, и представляет мощный инструмент ИИ для распознавания таких карманов по последовательности или структуре. Используя ErePOC для фокусировки скрининга DEL на белках, чьи карманы уже выглядят совместимыми с DEL, исследователи могут приоритизировать более перспективные цели, сократить напрасные усилия по скринингу и потенциально расширить область поиска в менее изученные классы, такие как хроматин и РНК‑связывающие белки. Кратко: исследование дает как более ясное представление о том, как выглядит «готовый к DEL» карман, так и практическую карту и компас для нахождения многих подобных карманов в человеческом протеоме.

Цитирование: Zhang, W., Wang, Y., Zhan, R. et al. Deciphering DEL pocket patterns through contrastive learning. Nat Commun 17, 2810 (2026). https://doi.org/10.1038/s41467-026-69663-y

Ключевые слова: ДНК-кодированные библиотеки, карманы белков, контрастное обучение, ИИ для открытия лекарств, ErePOC