Clear Sky Science · ru

Метапоисковый и адаптивный к задачам подход к прогнозированию аффинности лекарство-мишень

· Назад к списку

Обучение компьютеров выбирать лучшие лекарства

Поиск новых лекарств часто означает проверку миллионов возможных молекул, чтобы выяснить, какие из них связываются с нужными белковыми мишенями в организме. Лабораторные эксперименты медленные и дорогие, а даже современные мощные инструменты искусственного интеллекта могут ошибаться, когда для нового белка доступно лишь несколько измерений. В этой работе представлен AdaMBind — система обучения, разработанная для того, чтобы надежно предсказывать силу связывания препаратов с ранее невиданными мишенями, даже при скудных данных.

Figure 1
Figure 1.

Почему важна «прилипчивость» препарата к мишени

Когда препарат работает, это обычно потому, что он цепляется за конкретный белок и изменяет его функцию. Сила этого «зацепления», называемая аффинностью, — ключевой фактор при превращении перспективной молекулы в реальное средство. Классические лабораторные методы измеряют аффинность весьма точно, но требуют специализированного оборудования, квалифицированной подготовки и много времени. Компьютерные модели обещают гораздо более быстрый скрининг, но большинство современных подходов глубокого обучения предполагают наличие большого числа примеров для каждого белка. В реальной разработке лекарств многие интересные белки имеют лишь несколько известных соединений, поэтому модели, обученные обычным способом, склонны переобучаться на хорошо изученных мишенях и давать сбой на новых.

Учиться учиться на множестве небольших задач

AdaMBind решает эту проблему с помощью метаобучения, иногда называемого «обучением учиться». Вместо того чтобы рассматривать весь набор данных как одну большую задачу, метод разбивает его на множество мелких задач, каждая из которых сосредоточена на одном белке и всех протестированных против него препаратах. Модель обучается на этих задачах так, чтобы приобрести внутреннюю стартовую точку, которую можно быстро адаптировать под новый белок, используя лишь несколько известных измерений. Под капотом система представляет препараты как графы атомов и связей, а белки — как последовательности аминокислот. Разные нейронные сети обрабатывают каждую сторону и затем объединяют признаки для предсказания силы связывания, но ключевой поворот — это способ обучения модели на множестве задач.

От простых уроков к сложным

Не все задачи одинаково информативны. Некоторые наборы белок–препарат шумные или необычно сложные и могут ввести процесс обучения в заблуждение, если обращаться с ними как с чистыми задачами. AdaMBind включает адаптивный модуль задач, который постоянно оценивает задачи по тому, насколько хорошо обучение на небольшой «опорной» подвыборке переносится на отложенную «запросную» подвыборку. Задачи, которые дают меньшую ошибку и у которых направления обучения совпадают между опорной и запросной выборками, считаются «проще» и более надежными. Модуль придает этим задачам больший вес при выборке, так что модель сначала закрепляет то, что можно уверенно усвоить, а затем постепенно включает более сложные задачи. Такое планирование от легкого к трудному имитирует человеческое обучение и делает итоговую систему более стабильной и менее чувствительной к выбросам.

Figure 2
Figure 2.

Выделяясь при дефиците данных

Авторы протестировали AdaMBind на трех стандартных наборах по аффинности — BindingDB, KIBA и Davis — используя как щедрые, так и очень малые выборки на белок, а также с случайными разбиениями или намеренно непохожими тестовыми мишенями. Во всех почти всех условиях AdaMBind обогнал восемь сильных сравнительных методов, особенно когда для адаптации к новой мишени было доступно всего пять известных пар препарат–белок. Дополнительные тесты показали, что его производительность сохраняется даже когда новый белок имеет мало близких родственников в обучающем наборе, что указывает на то, что модель не просто запоминает похожие задачи, а извлекает широко применимые закономерности. Стратегия добавления шума в метки, которая мягко искажает значения аффинности во время обучения, дополнительно повышает устойчивость, не позволяя модели слишком сильно цепляться за потенциально неточные измерения.

От бенчмарков к реальным кандидатам в лекарства

Чтобы оценить практическую ценность, команда использовала AdaMBind для виртуального скрининга, похожего на реальные проекты. На сложном наборе данных, где лишь крошечная доля соединений действительно активна против таких мишеней, как ESR и TP53, метод сумел выдвинуть многие истинные хиты в верхние строки ранжирования, превосходя другие модели по метрикам, награждающим «раннее обогащение». Затем они применили AdaMBind к белку FLT3, связанному с лейкемией, просматривая большую базу данных препаратов в поисках сильных связывателей. Среди топовых предложений оказалась молекула стауроспорин. Последующие докинг-симуляции и лабораторные киназные тесты подтвердили, что стауроспорин ингибирует как нормальную, так и мутантную формы FLT3 с субнаномолярной активностью, даже сильнее, чем известный клинический ингибитор, демонстрируя, что предсказания модели могут указывать на действительно мощные молекулы.

Более умная отправная точка для будущих охотников за лекарствами

Проще говоря, AdaMBind предоставляет способ, с помощью которого ИИ-система может выработать хорошие «инстинкты» относительно связывания препарат–белок на основе множества небольших, несовершенных уроков и затем быстро применить эти инстинкты к новой, плохо изученной мишени. Решая, каким тренировочным задачам доверять в первую очередь, и оставаясь относительно нечувствительной к степени сходства новой мишени с прошлыми примерами, метод предлагает более надежный ориентир для виртуального скрининга при ограниченных данных. Хотя есть куда развиваться — например, включение более богатой 3D-информации и движение в сторону настоящих предсказаний при отсутствии данных — эта схема представляет шаг к более быстрому, гибкому и экономичному в данных открытию будущих лекарств.

Цитирование: Wan, M., Zhao, Y., Zhang, Y. et al. A meta learning and task adaptive approach for drug target affinity prediction. Nat Commun 17, 3734 (2026). https://doi.org/10.1038/s41467-026-70554-5

Ключевые слова: прогнозирование аффинности лекарство-мишень, метаобучение, виртуальный скрининг, обучение с малым количеством примеров, ингибиторы FLT3