Clear Sky Science · ru

MSCMF-DTB: многоуровневая система кросс-модальной фузии для предсказания связывания лекарство–мишень

· Назад к списку

Почему умный подбор лекарств важен

Установить, какие лекарства связываются с какими белками в организме, — всё равно что решать гигантскую трёхмерную головоломку с миллионами деталей. Проверять в лаборатории каждую возможную пару «лекарство–белок» медленно и дорого, поэтому исследователи обращаются к искусственному интеллекту, чтобы сузить круг поисков. В статье представлена MSCMF-DTB — новая система на основе глубокого обучения, предназначенная для предсказания того, будет ли лекарство связываться с белком и с какой силой. Объединяя несколько типов молекулярной информации в одной модели, она призвана ускорить разработку лекарств, помочь в перепрофилировании и сделать виртуальный скрининг более надёжным.

Рассматривать лекарства и белки под разными углами

Большинство компьютерных моделей представляют лекарство как последовательность символов, а белок — как строку букв. MSCMF-DTB идёт дальше: каждое лекарство рассматривается и как сеть атомов и связей, и как набор повторяющихся химических фрагментов, а белок — как последовательность, обогащённую контекстом, извлечённым из миллионов природных белков. Для лекарств модель строит граф, где атомы — узлы, а связи — ребра, и пропускает этот граф через глубокую сеть, которая постепенно улавливает паттерны от локальных окрестностей до целой молекулы. Параллельно второй канал фиксирует частоты появления определённых типов атомов и фрагментов, давая комплементарное, «сводное» представление о том же молекуле. Для белка мощная модель в стиле языковой сначала переводит каждую аминокислоту в вектор с учётом контекста, а затем эти векторы сканируются несколькими одномерными фильтрами разных размеров, чтобы выявлять локальные мотивы и более дальнедействующие закономерности вдоль последовательности.

Figure 1
Figure 1.

Учить модель замечать взаимное влияние

Видеть лекарства и белки по отдельности недостаточно; ключ в том, как они влияют друг на друга при встрече. MSCMF-DTB использует механизм кросс-внимания, чтобы представление лекарства могло избирательно «смотреть» на разные участки белка, и наоборот. Это позволяет модели выделять, какие атомы и фрагменты белка с наибольшей вероятностью будут взаимодействовать. Помимо этого специализированная тензорная сеть обучается более сложным, нелинейным комбинациям признаков лекарства и белка, выходя за рамки простого смешивания признаков. Выходы ветви графа, ветви отпечатков, ветви белка и ветви взаимодействия затем объединяются и подаются в окончательный модуль предсказания, который может выполнять либо бинарную классификацию «связывается/не связывается», либо непрерывную оценку аффинности.

Оценка системы на практике

Авторы протестировали MSCMF-DTB на широком наборе эталонных коллекций, которые широко используются в этой области. Для бинарных решений о связывании они проверяли модель на пяти наборах данных, охватывающих человека, модельного червя, семейство сигнальных рецепторов и крупные каталоги лекарств и белков, такие как BioSNAP и DrugBank. Для оценки силы связывания использовали DAVIS и KIBA — два стандартных набора, ориентированных на киназы и содержащих измеренные значения аффинности. На малых и больших коллекциях модель показала сильные и стабильные результаты, часто сопоставимые или превосходящие ведущие методы. На большом наборе DrugBank, например, она улучшила площадь под ROC-кривой до 3,2% и полноту на 6,1% по сравнению с предыдущей лучшей моделью, то есть находила больше истинных взаимодействий, сохраняя устойчивость при больших объёмах и разнообразии данных.

Figure 2
Figure 2.

Заглянуть внутрь и провести реалистичный тест

Чтобы убедиться, что модель не просто «чёрный ящик», исследователи изучили, на какие области реальных структур белков фокусировался механизм внимания, у которых известны сайты связывания с лекарствами. При наложении областей с высоким вниманием на трёхмерные модели белков многие выделенные остатки совпадали с экспериментально подтверждёнными участками связывания, что говорит о том, что система учит биологически значимые сигналы. Они также провели жёсткий «cold-start» эксперимент на мишени, связанной с раком, AKT1, полностью исключив этот белок из обучения. При ранжировании тысяч кандидатных соединений модель поместила несколько известных ингибиторов AKT1 в верхние предсказания, демонстрируя способность обобщать на ранее невидимые мишени и поддерживать сценарии виртуального скрининга и перепрофилирования.

Что это значит для будущих лекарств

Проще говоря, MSCMF-DTB — это многовидовой «свах» между лекарствами и белками. Объединяя детализированные атомные графы, статистику фрагментов и богатый контекст белковых последовательностей, а также явно моделируя, как эти компоненты взаимодействуют, она даёт более точные и стабильные предсказания по сравнению со многими существующими подходами. Хотя такая система не заменит лабораторные эксперименты, она может сильно сузить список перспективных кандидатов и подсказать, где могут образоваться важные контакты. В сочетании с физико-ориентированными симуляциями и экспериментальной валидацией такие фреймворки, как MSCMF-DTB, могут помочь сделать долгий и дорогостоящий путь от молекулы до лекарства быстрее, дешевле и более обоснованным.

Цитирование: Huang, J., Pan, Y. & Chen, Q. MSCMF-DTB: a multi-scale cross-modal fusion framework for drug–target binding prediction. Sci Rep 16, 13211 (2026). https://doi.org/10.1038/s41598-026-44048-9

Ключевые слова: взаимодействие лекарство–мишень, глубокое обучение в разработке лекарств, виртуальный скрининг, прогнозирование аффинности связывания, кросс-модальная фузия