Clear Sky Science · ru

MAMMAL - молекулярно выровненная мультимодальная архитектура и язык для биомедицинских открытий

2026-05-04 · Назад к списку

Почему важно умнее подходить к открытию лекарств

Поиск новых лекарств медленный, рискованный и чрезвычайно дорогой. Большинство кандидатов по‑прежнему терпят неудачу в клинических испытаниях, часто после многих лет работы. В то же время лаборатории биологии генерируют огромные массивы данных о генах, белках, клетках и химических соединениях. В этой статье представлена MAMMAL — новый тип системы искусственного интеллекта, который обучается на всех этих типах данных одновременно. Соединяя закономерности между молекулами, клетками и препаратами, она призвана помогать учёным выбирать лучшие мишени, проектировать более эффективные лекарства и раньше избегать дорогостоящих тупиков.

Один «мозг» для разных биологических данных

Современные инструменты ИИ в биомедицине часто узкоспециализированы: одна модель работает с последовательностями белков, другая — с малыми молекулами, третья — только с активностью генов. MAMMAL идёт по другому пути. Она рассматривает белки, антитела, малые молекулы и профили экспрессии генов как разные типы «предложений», которые может «читать» одна и та же модель. Для этого исследователи разработали гибкий способ преобразования каждого типа данных в общий последовательный формат и обучили крупную сеть на основе трансформера — сходную по идее с современными языковыми моделями — примерно на двух миллиардах примеров из общедоступных наборов данных по белкам, антителам, химии и данным на уровне клеток.

Изучение «языка» препаратов и клеток

MAMMAL предназначена как для понимания, так и для генерации биологической информации. Она может классифицировать, ранжировать или предсказывать численные величины, такие как сила связывания или эффективность препарата, а также генерировать новые последовательности, например предлагать фрагменты антител. Важная особенность — она работает не только с символами: модель может принимать и выдавать числовые значения напрямую, например измерения из лабораторных анализов. Это помогает ей рассуждать о том, насколько сильно препарат связывается с белком или как раковая клетка реагирует на лечение. Все эти задачи сведены к вариациям одной основной активности: преобразованию одной последовательности в другую, похожему на перевод между языками.

Тестирование модели на этапах разработки препаратов

Чтобы оценить, действительно ли такой единый подход полезен, авторы протестировали дообученные версии MAMMAL на одиннадцати разных бенчмарках, имитирующих реальные шаги в открытии лекарств. Сюда входило распознавание типов клеток по данным одиночных клеточных профилей экспрессии генов, прогнозирование способности малых молекул проникать через гематоэнцефалический барьер или вызывать токсические побочные эффекты, оценка реакции раковых клеток на разные препараты и предсказание силы связывания между белками или между белком и малой молекулой. MAMMAL достигла или превзошла лучшие известные результаты в девяти из одиннадцати тестов, часто превосходя высокоспециализированные модели, настроенные только на один тип данных.

Дизайн антител и опережение моделей структуры в их собственной игре

Некоторые из самых впечатляющих результатов получены в задачах, связанных с белками. В задаче «вставки» в антителе — где нужно заполнить наиболее переменные сегменты, которые непосредственно контактируют с мишенью — MAMMAL значительно чаще восстанавливала правильные аминокислоты по сравнению с ранними методами, особенно в печально известном центральном участке сайта связывания антитела. Команда также проверяла, может ли MAMMAL отличать связывающие и несвязывающие антитела, и сравнивала её с AlphaFold 3 — инструментом предсказания структуры, чьи оценки уверенности иногда используются как косвенная догадка о связывании. По пяти из семи тестовых мишеней, включая крупные гибкие белки, релевантные раку, предсказания связывания MAMMAL оказались явно точнее, несмотря на то что модель видела только последовательности, а не трёхмерные структуры.

Намёки на реальное влияние

Помимо бенчмарков, исследователи проверили, соответствуют ли предсказания модели лабораторным данным. Они рассмотрели четыре противораковых препарата, включая карфилзомиб, одобренный главным образом для кровяных онкологических заболеваний. MAMMAL правильно предсказала относительную силу этих препаратов на сотнях клеточных линий, и это ранжирование подтвердилось в целевых экспериментах. Это открытие намекает, что препарат может иметь более широкую активность в солидных опухолях, чем принято считать, — возможность, требующая дальнейших исследований. Модель также показала перспективность в совместных проектах по предсказанию активности антител против вирусов гриппа и других мишеней.

Что это значит для будущих лекарств

Проще говоря, MAMMAL действует как многоязычный читатель и писатель биологии, способный связывать события на уровнях генов, белков и химии в единой системе. Её высокая производительность в различных задачах говорит о том, что такие унифицированные модели могут стать основой для ИИ‑поддерживаемых «виртуальных клеток», помогающих учёным исследовать варианты лечения in silico прежде чем переходить в лабораторию. Хотя она не заменяет эксперименты — и по‑прежнему требует тщательной валидации — модель может сузить пространство поиска, выделить неожиданные возможности и сделать долгий путь от идеи до одобренного лекарства немного быстрее и эффективнее.

Цитирование: Shoshan, Y., Raboh, M., Ozery-Flato, M. et al. MAMMAL - Molecular Aligned Multi-Modal Architecture and Language for biomedical discovery. npj Drug Discov. 3, 14 (2026). https://doi.org/10.1038/s44386-026-00047-4

Ключевые слова: Открытие лекарств с поддержкой ИИ, мультимодальные биомедицинские модели, дизайн антител, взаимодействия белок–лекарство, профилирование экспрессии генов