Clear Sky Science · ru

Инжиниринг признаков на основе мультиомики с использованием биомедицинских фундаментальных моделей улучшает прогноз ответа на лечение у пациентов с воспалительными заболеваниями кишечника

· Назад к списку

Почему это исследование важно для пациентов

У людей с воспалительными заболеваниями кишечника (ВЗК) часто возникает разочаровывающий процесс проб и ошибок при назначении новых препаратов. Один и тот же препарат может значительно снизить тяжесть воспаления у одного человека и практически не помочь другому. В этом исследовании изучают, как мощные новые модели искусственного интеллекта (ИИ), изначально созданные для масштабного понимания биологии, можно перенаправить, чтобы извлечь гораздо больше информации из небольших наборов данных пациентов. Цель проста, но амбициозна: использовать генетический и молекулярный профиль каждого человека, чтобы заранее предсказать, насколько эффективно он ответит на распространённый препарат при ВЗК.

Figure 1
Figure 1.

Применение крупного ИИ в малых исследованиях

Традиционные медицинские инструменты на основе ИИ испытывают трудности, когда количество пациентов невелико, даже если каждый пациент подробно охарактеризован. В этой работе исследователи изменили подход, заимствуя знания у огромной «фундаментальной» модели под названием MAMMAL, изначально обученной на больших коллекциях данных о белках и препаратах. Вместо дообучения этой модели они используют её как умный калькулятор, оценивающий, с какой силой тот или иной препарат связывается с тысячами человеческих белков. Эти оценки силы связывания затем становятся новыми, информативными признаками, которые можно подставить в более скромные модели машинного обучения, адаптированные к 51 пациенту с ВЗК в этом исследовании.

Взгляд внутрь кишечника: ДНК и РНК

Команда работала с образцами ткани, взятыми из воспалённых участков кишечника у людей с язвенным колитом или болезнью Крона. Из каждого образца они измеряли два основных уровня биологии: ДНК, с акцентом на небольшие генетические изменения, называемые SNP, и РНК, которая отражает активность генов в ткани. Также ткань подвергали воздействию преднизолона, стандартного стероида первой линии при ВЗК, и измеряли, насколько снизился уровень ключевого воспалительного сигнала TNFα в ответ. Это изменение TNFα использовали в качестве прокси для оценки того, насколько хорошо ткань конкретного пациента ответила на препарат. Задача состояла в том, чтобы связать тысячи генетических и молекулярных измерений с этим результатом ответа на лечение.

Обучение моделей тому, на что обращать внимание

Первый шаг — определить, какие белки и гены должны быть наиболее важны для моделей. С помощью фундаментальной модели исследователи оценили, насколько плотно преднизолон связывается более чем с 11 000 человеческих белков, затем сосредоточились на верхних 5% с наибольшей предсказанной аффинностью. Обнадеживающе, в этот короткий список вошли известные мишени препарата и белки, участвующие в химическом восприятии и сигналинге, что говорит о биологической обоснованности ранжирования ИИ. Далее они объединили этот список с индивидуальными изменениями ДНК каждого пациента, создав персонализированные «мутированные» последовательности белков и пересчитав, как каждая мутация может слегка усилить или ослабить связывание преднизолона. Эти предсказанные сдвиги в силе связывания стали компактными, специфичными для пациента признаками, отражающими то, как варианты в ключевых белках могут изменить действие препарата.

Figure 2
Figure 2.

Сочетание генетических сигналов с активностью генов

Далее команда добавила данные об активности генов из измерений РНК, взятых из той же ткани кишечника, используемой в тестах препарата. Для каждого приоритетного белка они сопоставили его предсказанную силу связывания с активностью соответствующего гена, а также перемножили эти величины, чтобы создать «состояние взаимодействия», отражающее и ожидаемую силу связывания препарата, и количество мишени в ткани. Модели машинного обучения, обученные на этих обогащённых признаках, лучше различали образцы, которые хорошо ответили на преднизолон, и те, которые не ответили, по сравнению с моделями, использовавшими более простые представления тех же данных ДНК. Некоторые из наиболее влиятельных признаков указывали на семейства рецепторов, связанных с обонянием, и на рецептор, участвующий в тормозной мозговой сигнализации через GABA, что намекает на недооценённые роли этих белков в воспалении кишечника и ответе на стероиды.

Делая сложные инструменты доступными для неспециалистов

Помимо биологии, исследователи решили практическую проблему: в большинстве лабораторий нет вычислительной экспертизы для запуска крупных фундаментальных моделей. Чтобы решить это, они обернули свой рабочий процесс по оценке аффинности связывания в открытый сервер Model Context Protocol (MCP), к которому можно обращаться напрямую через ИИ-помощников, таких как Claude или ChatGPT. С такой настройкой учёный может на обычном языке запросить предсказание связывания между препаратом и набором белков, а система незаметно выполнит технические шаги за кулисами. Это снижает барьер для других, желающих исследовать похожие вопросы персонализированного ответа на препараты с использованием собственных данных.

Что это означает для будущего выбора лечения

Проще говоря, эта работа показывает, как одна мощная модель ИИ, обученная на огромных публичных наборах данных, может помочь небольшим клиническим исследованиям получить гораздо больше пользы. Превращая сырые ДНК-варианты и активность генов в более богатые, осведомлённые о биологии признаки, авторы улучшили точность моделей, предсказывающих, кто с наибольшей вероятностью извлечёт пользу из преднизолона. Результаты пока ранние и основаны на ограниченном числе пациентов, поэтому конкретные связи между генами и препаратом, которые они выделяют, потребуют дальнейшей проверки. Но общая стратегия — использование фундаментальных моделей как умных генераторов признаков и предоставление к ним простых интерфейсов — указывает на будущее, в котором врачи смогут применять многослойные молекулярные тесты, интерпретированные ИИ, чтобы выбрать правильный препарат и дозу для каждого пациента с ВЗК.

Цитирование: Gardiner, LJ., Kelly, J., Evans, A. et al. Multi-omics feature engineering driven by biomedical foundation models improves drug response prediction for inflammatory bowel disease patients. Sci Rep 16, 13820 (2026). https://doi.org/10.1038/s41598-026-44366-y

Ключевые слова: воспалительное заболевание кишечника, прогноз ответа на лечение, биомедицинские фундаментальные модели, мультиомика, персонализированная медицина