Clear Sky Science · ru
ConvAHKG: гибридный граф знаний на основе действий с двойным свёрточным подходом для репрофайпинга лекарств
Новые применения для старых лекарств
Вывод полностью нового препарата на рынок может занимать более десятилетия и стоить миллиарды долларов, при этом многие кандидаты терпят неудачу по ходу. В этом исследовании рассматривается более умный путь: использование данных и искусственного интеллекта для выявления новых заболеваний, которые существующие одобренные лекарства могли бы безопасно лечить. Авторы представляют рамочную систему под названием ConvAHKG, которая объединяет различные виды биомедицинской информации в единую связанную карту и затем использует современную нейронную сеть для выявления перспективных пар «лекарство—заболевание», предлагая более быстрый и недорогой путь к новым терапиям.
Богатая карта взаимодействий лекарств и болезней
В основе работы лежит «гибридный граф знаний», гигантская карта, связывающая лекарства, заболевания, белки, побочные эффекты, химические структуры и биологические пути. Вместо простых двоичных связей (например, «лекарство A лечит заболевание B») карта фиксирует, как именно лекарство действует на белок — активирует ли оно, ингибирует или связывается с ним — и как белки вовлечены в заболевания, например служат ли они биомаркерами или меняют активность. В графе содержится более 11 000 сущностей и 59 типов отношений, включая подробную информацию о классификации лекарств, побочных эффектах, контактах белок–белок и химических подструктурах. Фиксируя эти многочисленные уровни контекста, граф может отражать большую часть реальной биологической сложности, лежащей в основе лечебных эффектов и нежелательных реакций. 
Обучение компьютера языку биологии
Чтобы сделать эту сложную карту пригодной для машинного обучения, команда преобразует каждую связь в графе в простое трёхчастное «предложение»: голову (например, заболевание), отношение (например, биомаркер) и хвост (например, белок). Затем они применяют Word2Vec, метод, изначально разработанный для обработки естественного языка, чтобы получить числовые «встраивания» (embeddings) для каждого лекарства, заболевания и белка. Элементы, которые часто появляются вместе в этих «предложениях», оказываются близкими в этом математическом пространстве, подобно словам с похожим значением в тексте. Этот подход гораздо проще и быстрее многих специализированных методов встраивания графов, при этом он улавливает тонкие закономерности. В тестах по сравнению с несколькими популярными методами встраивания графов Word2Vec сопоставим или превосходил их по прогностической мощности, при этом требуя значительно меньше вычислительных ресурсов.
Двойной нейронный путь для решений «да/нет» о лечении
После того как каждое лекарство и заболевание переводятся в числовой вектор, ConvAHKG подаёт их в двумодульную одномерную свёрточную нейронную сеть. Один канал обрабатывает вектор лекарства, другой — вектор заболевания, применяя последовательность свёрточных фильтров, которые обнаруживают локальные паттерны и более широкие мотивы, вдохновлённые архитектурами распознавания изображений, такими как InceptionNet и AlexNet. После отдельной обработки два потока объединяются и проходят через несколько полностью связанных слоёв, которые выдают единственную вероятность: представляет ли эта пара «лекарство—заболевание» вероятное эффективное лечение или скорее вредный побочный эффект? Чтобы учесть тот факт, что известные положительные пары встречаются гораздо реже, чем отрицательные, авторы вводят взвешенную функцию потерь, которая сильнее штрафует пропуск истинных эффективных лечений, что улучшает работу на этих труднонаходимых случаях. 
Превосходство над существующими методами и выявление кандидатов против рака
Исследователи тщательно протестировали свою систему против нескольких передовых инструментов репрофайпинга, использующих матричную факторизацию, графовые нейронные сети и глубокие автокодировщики. ConvAHKG достиг значения площади под ROC-кривой 0.9836 и площади под кривой точность—полнота 0.9686, превзойдя все конкурирующие подходы на том же эталонном наборе данных. Затем они применили модель к немелкоклеточному раку лёгкого — наиболее распространённой и смертоносной форме рака лёгкого в мире. ConvAHKG выделил несколько препаратов, ранее не помеченных как средства для лечения этого заболевания, включая антитело трастузумаб, нацеленное на белок HER2 и уже имеющее поддерживающие клинические данные при раке лёгкого, а также другие биологические агенты и даже классический антибиотик бензилпенициллин. Модель докинга указывает, что бензилпенициллин может сильно связываться с ДНК и с топоизомеразой II альфа — ферментом, часто повышенным в этих опухолях, что наводит на возможный противораковый механизм, заслуживающий лабораторной проверки.
Почему это важно для пациентов
Проще говоря, ConvAHKG действует как высокоинформированный сват между существующими лекарствами и заболеваниями, используя детализированную карту биологических действий и мощный механизм распознавания закономерностей для предсказания того, какие старые препараты могут сработать в новых условиях. Рассматривая проверенные по безопасности препараты как многократно используемые строительные блоки, а не как инструменты единственного назначения, эта система может ускорить обнаружение терапий для таких состояний, как рак лёгкого, особенно там, где традиционная разработка лекарств слишком медленна или дорога. Хотя предсказания всё ещё требуют тщательной экспериментальной и клинической валидации, исследование показывает, что сочетание богатых биологических знаний с современной ИИ может существенно сузить пространство поиска и приблизить потенциально спасительные лечения к пациентам гораздо быстрее.
Цитирование: Khodadadi AghGhaleh, M., Abedian, R., Zarghami, R. et al. ConvAHKG: Action-based hybrid knowledge graph with a dual-channel convolutional approach for drug repurposing. Sci Rep 16, 7592 (2026). https://doi.org/10.1038/s41598-026-38656-8
Ключевые слова: переназначение лекарств, граф знаний, глубокое обучение, рак лёгкого, поиск лекарств