Clear Sky Science · ru
Отчет о переносимости: оценка способности модели-основы с метаобучением предсказывать антибактериальную активность природных продуктов
Поиск новых антибиотиков быстрее
Устойчивость к антибиотикам растет, а открытие новых препаратов происходит крайне медленно и часто сводится к пробам и ошибкам в лаборатории. В этом исследовании рассматривается, можно ли с помощью мощного типа искусственного интеллекта, изначально обученного на обширных наборах данных о лекарствах, быстро адаптировать модель для предсказания того, какие растительные природные соединения могут бороться с бактериями — используя лишь небольшие объемы новых экспериментальных данных. Если это удастся, такие инструменты помогут ученым сосредоточить дорогое лабораторное время на самых перспективных кандидатах и ускорить поиск следующего поколения антибиотиков.
Почему важны растительные соединения
Многие из наших лучших антибиотиков берут начало в природных продуктах растений и микроорганизмов. Эти молекулы способны останавливать рост бактерий, но найти новые в природе все равно похоже на поиск иголки в стоге сена. Исследователям приходится испытывать множество соединений на различных штаммах бактерий, и каждый тест стоит дорого. Хуже то, что большие аккуратно размеченные наборы данных — которые необходимы современным методам глубокого обучения для высокой эффективности — в этой области редки. Это делает открытие антибиотиков отличной площадкой для «модель-основ»: больших универсальных систем ИИ, которые можно дообучить для конкретных задач всего на нескольких примерах.

Модель-основа изучает убивающие микробы вещества
Команда сосредоточилась на модели-основе под названием ActFound, изначально обученной предсказывать, насколько сильно различные химические вещества воздействуют на биологические мишени, используя огромные наборы данных из ресурсов вроде баз ChEMBL и BindingDB. Вместо того чтобы предсказывать одно число для каждого соединения, ActFound обучается, сравнивая пары соединений в рамках одного эксперимента и оценивая, какое из них более активно. Такое «парное» обучение в сочетании со стратегией обучения, известной как метаобучение, призвано помочь модели быстро адаптироваться к новым задачам предсказания, когда доступно лишь небольшое число размеченных примеров — как это часто бывает в скринингах антибиотиков.
Тестирование модели на реальных данных о растениях
Чтобы проверить, насколько действительно переносима ActFound, авторы дообучили ее на курированном наборе данных природных продуктов растительного происхождения, протестированных на способность ингибировать рост различных бактерий. Каждый штамм бактерий рассматривался как отдельная задача, и модель адаптировали, используя лишь от 8 до 128 соединений на штамм или фиксированные проценты доступных данных. Они также сравнили ActFound с более простыми моделями метаобучения и переносного обучения, которые не используют парные сравнения. В этих тестах ActFound не достигла точности, показанной ранее на других типах данных о лекарствах. Однако при крайне малых объемах данных — примерно всего по нескольку соединений на штамм — ActFound и ее вариант с переносным обучением в целом не уступали и часто превосходили альтернативные методы.
Когда сходство помогает — и когда вредит
ActFound исходит из предположения, что похожие молекулы ведут себя схожим образом, что хорошо работает, когда наборы данных сформированы вокруг групп родственных химикатов. Набор данных природных продуктов, однако, оказался химически разнообразным и часто лишенным близких «семейств» соединений. Это разнообразие, несмотря на свою научную ценность, подрывало парную стратегию обучения: когда соединения в эксперименте сильно отличаются друг от друга, модели трудно выучить стабильные сравнения. Авторы также обнаружили, что простая диагностическая мера, предложенная в оригинальной статье об ActFound для предварительного предсказания того, как хорошо модель покажет себя в новой задаче, не сработала для этих данных о природных продуктах, что подчеркивает важное ограничение при переходе в новые химические пространства.

Что это значит для будущего открытия препаратов
Для неспециалистов вывод таков: модели-основы вроде ActFound — перспективные инструменты для открытия лекарств при дефиците данных, но они не панацея. В этом исследовании ActFound и ее вариант с переносным обучением часто показывали результаты не хуже или лучше конкурентов при наличии лишь нескольких растительных соединений для обучения, однако они испытывали трудности на этом сильно разнообразном наборе природных продуктов. Работа указывает на то, что эти модели ИИ наиболее полезны, когда данные содержат много химически похожих соединений — например, в целенаправленных исследованиях соотношения структуры и активности — но они остаются менее надежными при предсказании поведения совершенно новых типов молекул. Иными словами, ИИ может помочь сузить поиск, но самая трудная часть исследования по-настоящему новой химической территории еще впереди.
Цитирование: Butt, C.M., Walker, A.S. Reusability Report: Evaluating the performance of a meta-learning foundation model on predicting the antibacterial activity of natural products. Nat Mach Intell 8, 270–275 (2026). https://doi.org/10.1038/s42256-026-01187-y
Ключевые слова: поиск антибиотиков, природные продукты, глубокое обучение, метаобучение, скрининг лекарств