Clear Sky Science · ru

Иерархическая сеть передачи сообщений для точного предсказания свойств молекул

· Назад к списку

Умные короткие пути для поиска лучших лекарств

Выведение нового лекарства на рынок занимает много времени и стоит дорого, отчасти потому, что химикам приходится проверять в лаборатории огромное число молекул, чтобы установить их безопасность, эффективность и поведение в организме. В этом исследовании представлен новый модель искусственного интеллекта, названная HimNet, призванная гораздо точнее предсказывать эти ключевые лекарственные свойства по структуре молекулы, помогая учёным сосредоточить эксперименты на наиболее перспективных кандидатах.

Почему так сложно предсказать поведение молекулы

Каждое потенциальное лекарство должно удовлетворять строгому набору критериев, известному как ADMET: как оно всасывается, распределяется, метаболизируется, выводится и токсично ли оно. Традиционные компьютерные модели либо опираются на вручную составленные химические правила, либо на системы глубокого обучения, рассматривающие молекулы как простые сети атомов и связей. Эти старые подходы часто упускают то, как разные части молекулы взаимодействуют тонкими, неаддитивными способами — например, как две удалённые кольцевые системы могут стекаться или как полярная группа с одной стороны ослабляет эффект жирного фрагмента с другой. В результате прогнозы по растворимости, токсичности или проницаемости через гематоэнцефалический барьер могут быть ненадёжны при изучении новых областей химического пространства.

Рассмотрение молекул многослойно

HimNet решает эту проблему, одновременно рассматривая молекулу на нескольких уровнях. На самом тонком уровне он отслеживает отдельные атомы и связи между ними. Второй уровень группирует атомы в химически значимые «мотивы», такие как ароматические кольца или кислотные группы, а третий, глобальный уровень представляет целую молекулу. HimNet передаёт информацию между этими слоями с помощью иерархического механизма передачи сообщений — по сути структурированного диалога, в котором атомы «разговаривают» с мотивами, мотивы взаимодействуют друг с другом, и всё это формирует общее представление о поведении молекулы. Параллельно модель анализирует стандартные молекулярные «отпечатки» (fingerprints), компактные цифровые представления, широко используемые в медицинской химии, и узнаёт, какие аспекты этих отпечатков наиболее постоянны при разных описаниях одной и той же молекулы.

Figure 1
Figure 1.

Обучение модели выделять важное

Ключевая идея HimNet — внимание: модель обучается выделять, какие атомы и мотивы наиболее важны для заданного свойства и как их влияния усиливают или компенсируют друг друга. Один путь в сети внимательно следует реальным химическим связям, сохраняя локальные детали, которым доверяют химики. Второй путь строит дальнодействующие «мосты» через молекулу, позволяя удалённым группам взаимодействовать, даже если они разделены несколькими связями. Обучаемый шлюз объединяет эти два потока, уравновешивая строгую химическую связность и гибкий глобальный контекст. Дополнительные модули выравнивают многослойное графовое представление с представлением-отпечатком, давая итоговую компактную векторную репрезентацию, которая учитывает и тонкую структуру, и более широкие химические закономерности.

Проверка подхода

Чтобы оценить эффективность этой архитектуры, авторы протестировали HimNet на одиннадцати наборах данных, охватывающих множество задач, важных для поиска лекарств. Среди них классические бенчмарки по токсичности, проницаемости через гематоэнцефалический барьер и базовым физическим свойствам, таким как растворимость, а также более сложные реальные задачи: метаболическая стабильность, антималярийная активность и очистка печенью в разных видах. По большинству задач HimNet сопоставим или превосходит лучшие существующие модели, часто с заметным отрывом. Важно, что модель оставалась устойчивой даже на сложных наборах данных, хотя точность снижалась в случае очень маленьких, шумных или сильно несбалансированных коллекций, где затрудняются любые методы. Абляционные исследования — систематическое исключение компонентов архитектуры — показали, что каждая часть, от межуровневого внимания до слияния с отпечатками, вносит измеримый вклад в точность.

Figure 2
Figure 2.

Видение химии глазами модели

Поскольку HimNet использует внимание на нескольких уровнях, его предсказания можно визуализировать так, чтобы химики могли их интерпретировать. В исследовательских примерах по проницаемости через гематоэнцефалический барьер области молекулы, повышающие проникновение, подсвечивались тёплыми цветами, а признаки, препятствующие проникновению, — холодными. Гидрофобные кольца и фторированные мотивы обычно увеличивали проницаемость, тогда как сильно полярные группы, такие как карбоновые кислоты или некоторые карбонильные и азотные центры, часто её снижали. Поразительно, что модель иногда относилась к двум внешне похожим кольцам по-разному в зависимости от их окружения, отражая то, как реальный химический контекст может сделать одну часть молекулы полезной, а другую — вредной.

Что это значит для будущих лекарств

Для неспециалистов ключевое сообщение таково: HimNet предлагает более тонкий способ «чтения» молекул с помощью ИИ — не просто как списков атомов, а как взаимодействующих частей, чьё суммарное поведение определяет, станет ли соединение хорошим лекарством. За счёт учёта многоуровневых взаимодействий и объяснения своего внимания в химически осмысленных терминах HimNet может помочь исследователям увереннее просеивать огромные виртуальные библиотеки. Хотя метод требует больших вычислительных ресурсов и ещё нуждается в расширениях для работы с полной трёхмерной формой и очень гибкими молекулами, он указывает путь к более умным и прозрачным инструментам, которые могут сократить путь от молекулярной идеи до безопасного и эффективного лекарства.

Цитирование: Hong, H., Wu, X., Sun, H. et al. A hierarchical interaction message net for accurate molecular property prediction. Commun Chem 9, 150 (2026). https://doi.org/10.1038/s42004-026-01922-x

Ключевые слова: предсказание свойств молекул, графовые нейронные сети, поиск лекарств, моделирование ADMET, объяснимый ИИ