Clear Sky Science · ru

Прогнозатор фармакокинетики на основе машинного обучения (EGFR-PROPK) для PROTAC-ов, нацеленных на EGFR

· Назад к списку

Более разумный дизайн лекарств для трудноизлечимых раков

Многие перспективные противораковые препараты терпят неудачу не потому, что не попадают в цель, а потому что организм слишком быстро их выводит, откладывает в неправильных местах или плохо их всасывает. Новый класс препаратов — PROTAC — может уничтожать болезнетворные белки, которые ранее считались «нелекарственными», но их поведение в организме особенно трудно прогнозировать. В этом исследовании представлен инструмент машинного обучения EGFR-PROPK, специально разработанный для предсказания того, как группа PROTAC-ов, нацеленных на ключевой онкобелок, перемещается в организме, с целью помочь ученым выбирать лучшие кандидаты на ранних этапах и тратить меньше лет и ресурсов на тупики.

Figure 1
Figure 1.

Новые препараты, разрушающие белки, и их сложности

PROTAC-ы — необычные препараты: вместо того чтобы просто блокировать белок, они помечают его для утилизации собственными клеточными механизмами разрушения. Каждый PROTAC связывает участок, распознающий цель заболевания, с участком, привлекающим клеточный «измельчитель», соединённые гибкой цепочкой. Такая конструкция позволяет им атаковать белки, до которых обычным препаратам трудно добраться, и часто допускает временное связывание вместо постоянного занятия сайта белка. Однако тот же размер и сложность усложняют доставку и контроль PROTAC-ов в организме. Они склонны быть крупными, относительно липофильными и сильно связываться с белками крови, что осложняет их всасывание, распределение, метаболизм и выведение.

Почему привычные правила для поведения лекарств не работают

Традиционные разработчики лекарств используют простые показатели, такие как молекулярная масса, липофильность (LogP) и эмпирические меры «подобия лекарствам», чтобы предположить, как соединение поведёт себя в организме. Исследователи задались вопросом, могут ли эти знакомые метрики объяснить поведение 100 PROTAC-ов, нацеленных на рецептор эпидермального фактора роста (EGFR) — ключевой драйвер многих онкозаболеваний — в живых мышах. Они сосредоточились на трёх свойствах: клиренс (насколько быстро организм выводит препарат), период полувыведения (как долго препарат остаётся в циркуляции) и кажущийся объём распределения (насколько широко он распределяется по тканям). При сравнении этих свойств с базовыми дескрипторами точки данных были разбросаны без явных закономерностей, что показывает: простые химические правила недостаточны для прогнозирования поведения PROTAC-ов.

Обучение специально созданного предиктора

Чтобы восполнить этот пробел, команда создала EGFR-PROPK — предиктор на основе машинного обучения, настроенный специально для PROTAC-ов, нацеленных на EGFR. Сначала они провели эксперименты на мышах с 100 различными PROTAC-ами, измерив их клиренс, период полувыведения и объём распределения после дозирования. Затем каждую молекулу описали при помощи нескольких подробных «отпечатков», кодирующих её структуру, и рассчитали ещё 200 химических признаков. Эти числовые описания были поданы на вход модели на базе CatBoost — современного алгоритма, хорошо работающего с табличными данными. В отличие от универсальных инструментов, EGFR-PROPK обучали непосредственно на in vivo-результатах для PROTAC-ов, что позволило модели уловить тонкие связи между сложными формами линкеров, общей величиной молекул и временем их нахождения в крови или распределения по тканям.

Превосходство над общими моделями и выявление скрытых нюансов

Исследователи сравнили EGFR-PROPK с широко используемыми платформами прогнозирования, в основном созданными для классических малых молекул. Когда эти универсальные модели применяли «как есть» к PROTAC-ам, их прогнозы были плохими: оценённые значения периода полувыведения, клиренса и тканевого распределения часто сильно расходились с реальными измерениями. Даже после дополнительной настройки одного из конкурирующих моделей на данных PROTAC-ов она по-прежнему отставала. Напротив, EGFR-PROPK показал существенно лучшее согласование предсказанных и экспериментальных значений, особенно для периода полувыведения и клиренса, с умеренным улучшением для распределения. Модель также справилась с реальными кейсами: два PROTAC-а с очень похожими структурами, но очень разным поведением были точнее различимы EGFR-PROPK, чем универсальными инструментами, подчёркивая важность обучения на данных, специфичных для PROTAC.

Figure 2
Figure 2.

Карта химического пространства и её ограничения

Помимо показателей эффективности команда проверила, охватывает ли их набор из 100 PROTAC-ов широкий диапазон конструкций или лишь узкий угол химического пространства. Упрощая молекулы до их основных каркасов и визуализируя их среди тысяч запатентованных PROTAC-ов, они показали, что их набор охватывает многие различные структурные типы, особенно в гибких линкерах. Это означает, что модель хорошо подходит для оптимизации EGFR-направленных PROTAC-ов, которые разделяют ключевые строительные блоки, но отличаются способом соединения частей. Вместе с тем авторы подчёркивают, что инструмент является специализированным: его точность может снижаться для PROTAC-ов, построенных вокруг полностью других целей или путей деградации, что указывает на необходимость дальнейшего расширения и переноса обучения между наборами данных.

Что это значит для будущих препаратов

Для неспециалистов главный вывод таков: «трубопроводы» препарата в организме — как он всасывается, куда попадает и как долго остаётся — могут сделать или сломать перспективную противораковую терапию, и привычные упрощения для малых таблеток плохо работают для препаратов следующего поколения, таких как PROTAC-ы. Создав EGFR-PROPK, исследователи показали, что тщательно собранные данные на животных в сочетании с продвинутыми методами распознавания образов дают гораздо более ясное раннее представление о том, как эти сложные молекулы будут вести себя. Такой целевой прогноз поможет химикам проектировать PROTAC-ы, которые не только разрушат нужные белки, но и достигнут их в нужных концентрациях, прокладывая путь к более эффективным и безопасным лечениям устойчивых форм рака.

Цитирование: Zhang, R., Li, F., Liu, Y. et al. A machine learning-based pharmacokinetics predictor (EGFR-PROPK) for EGFR-targeting PROTACs. Commun Chem 9, 134 (2026). https://doi.org/10.1038/s42004-026-01938-3

Ключевые слова: фармакокинетика PROTAC, дегрейдеры, нацеленные на EGFR, машинное обучение в разработке лекарств, прогнозирование ADMET, целевое разрушение белков