Clear Sky Science · ru
Ускорение разработки сверхкритических фармацевтических формуляций с помощью интерпретируемого прогностического моделирования растворимости препаратов
Почему это важно для медицины будущего
Многие перспективные препараты так и не попадают к пациентам, потому что они недостаточно хорошо растворяются, чтобы организм мог их усвоить. Исследование, лежащее в основе этой статьи, изучает, как на компьютере предсказывать, насколько легко различные лекарства растворяются в особой форме диоксида углерода — сверхкритической жидкости. Используя современные методы, основанные на данных, авторы стремятся сократить дорогостоящие лабораторные эксперименты методом проб и ошибок и ускорить путь от молекулы к лекарству.
Более чистый способ изготовления труднорастворимых препаратов
Сверхкритический диоксид углерода ведёт себя как жидкость и как газ одновременно, что даёт ему необычные свойства по переносу и формированию молекул лекарств. Он может помогать формировать наночастицы, загружать препараты в транспортные системы и при этом не оставлять токсичных растворителей. Тем не менее каждый препарат реагирует по‑разному: изменения давления, температуры и самой структуры молекулы могут сильно влиять на её растворимость. Измерять эти эффекты для каждого нового соединения в высоконапорном оборудовании медленно и дорого, поэтому способность предсказывать растворимость на основании данных представляет большой интерес для специалистов по формуляциям и производителей лекарств.

Построение интеллектуального предсказательного механизма
Чтобы справиться с этой задачей, исследователи собрали 252 качественных измерения из предыдущих экспериментов по семи очень разным препаратам — от средств при язве и эпилепсии до противогрибковых и противовирусных средств. Для каждой точки данных они зафиксировали базовые условия, такие как температура и давление, а также простые свойства препарата: молекулярную массу и температуру плавления. Затем они обучили несколько моделей машинного обучения, чтобы выявить связь между этими входными параметрами и тем, сколько каждого препарата растворяется в сверхкритическом диоксиде углерода. Были использованы два основных типа моделей: регрессия опорных векторов, которая стремится провести гладкую кривую через данные, и алгоритм экстремального градиентного бустинга, продвинутый древовидный метод, объединяющий множество небольших решающих деревьев в один мощный предсказатель.
Разрешая настройку моделей природоподобными поисковыми алгоритмами
Выбор внутренних настроек моделей, известных как гиперпараметры, существенно влияет на их эффективность. Вместо угадывания или простого перебора команда заимствовала идеи из поведения животных. Они применили два «биологически вдохновлённых» метода оптимизации: один основан на поиске пищи и миграции серых гусей, другой — на тактиках выживания рогатых ящериц. Эти алгоритмы исследуют множество комбинаций настроек моделей и постепенно переходят к тем, которые дают наиболее точные предсказания с наименьшей ошибкой. Описав задачу как многокритериальную, авторы одновременнo учитывали две цели: минимизацию ошибки предсказания и максимизацию доли объяснённой вариации в данных, при этом контролируя затраты вычислительного времени.

Понимание того, какие рычаги важны
Помимо чистой точности, авторы хотели, чтобы модель давала научное понимание, а не оставалась таинственной «чёрной коробкой». Они использовали два дополняющих друг друга аналитических инструмента, чтобы оценить, насколько сильно каждый входной фактор влияет на выход модели и как эти факторы взаимодействуют между собой. Обе техники выделили давление и молекулярную массу как наиболее значимые факторы: повышение давления как правило увеличивало растворимость за счёт более плотной упаковки диоксида углерода, тогда как более тяжёлые молекулы склонны растворяться хуже. Температура и температура плавления играли более тонкую, но всё же заметную роль, прежде всего через взаимодействие с давлением и отражая, насколько прочно кристаллическая структура препарата удерживает молекулы. Модель также воспроизвела известные термодинамические закономерности, например то, что изменение температуры может усиливать или ослаблять эффект давления в зависимости от диапазона, что придаёт уверенность в том, что она улавливает реальное физическое поведение, а не просто запоминает числа.
Что означают результаты для разработки лекарств
Лучшее гибридное решение, комбинирующее градиентный бустинг с оптимизатором, вдохновлённым рогатыми ящерицами, сократило ошибку предсказания примерно на 40 процентов по сравнению с ненастроенным базовым вариантом. Оно хорошо повторяло не только средние значения растворимости, наблюдаемые в экспериментах, но и их разброс, включая редкие случаи высокой растворимости. Такой уровень точности позволяет использовать модель в качестве мощного инструмента предварительного отбора: исследователи могут исследовать диапазоны давления и температуры на ноутбуке, прежде чем переходить к дорогостоящим высоконапорным экспериментам, снижая бесполезные затраты на слабые кандидаты. Хотя подход всё ещё опирается на ограничённый набор данных и сравнительно небольшой набор свойств препаратов, а наиболее точная версия требует значительных вычислительных ресурсов, эта схема показывает, как интерпретируемое машинное обучение может одновременно ускорить безрастворительную (без растворителей) формуляцию и углубить наше понимание того, почему одни препараты растворяются лучше других в сверхкритическом диоксиде углерода.
Цитирование: Khafagy, ES., Lila, A.S.A. & Pishnamazi, M. Accelerating supercritical pharmaceutical formulation via interpretable data-driven prediction of drug solubility. Sci Rep 16, 11006 (2026). https://doi.org/10.1038/s41598-026-44161-9
Ключевые слова: растворимость лекарств, сверхкритический диоксид углерода, машинное обучение, фармацевтическая формуляция, моделирование на основе данных