Clear Sky Science · ru

Идентификация диагностических и прогностических биомаркеров аденокарциномы легкого с помощью интегрированного биоинформатического анализа и валидации методом ПЦР в реальном времени

· Назад к списку

Почему раннее обнаружение рака легких важно

Рак легкого — один из наиболее смертоносных видов рака, во многом потому, что часто обнаруживается слишком поздно. Наиболее распространенная форма, аденокарцинома легкого, может долго развиваться бессимптомно. В этом исследовании изучают, могут ли образцы крови и опухолевой ткани обнаруживать болезнь гораздо раньше. Объединив крупные генетические наборы данных с методами искусственного интеллекта и затем проверив результаты на реальных пациентах, исследователи стремятся выявить простые маркеры в крови, которые в будущем помогут врачам раньше диагностировать рак легкого и корректировать лечение.

Поиск предвестников в генах

Команда начала с данных РНК‑секвенирования от 522 человек, включая 506 пациентов с аденокарциномой легкого и 16 здоровых контрольных участников. РНК — это «рабочая копия» генов, отражающая, какие гены в клетках включены или выключены. После тщательной очистки и нормализации данных они сравнили уровни активности генов в образцах с раком и без него. Это выявило 3 513 генов, активность которых существенно отличалась у пациентов. Эти гены, называемые дифференциально экспрессируемыми, стали исходным материалом для компьютерной модели, способной научиться отличать раковые и здоровые образцы по генетическим шаблонам.

Figure 1
Figure 1.

Обучение компьютеров распознавать рак

Чтобы просеять тысячи генов, исследователи использовали подход глубокого обучения — разновидность искусственного интеллекта, вдохновленную сетями нейронов. Они построили нейронную сеть с несколькими скрытыми слоями, которая получала данные об активности генов и училась классифицировать каждый образец как раковый или здоровый. Модель обучали на большей части данных, а затем тестировали на отдельной порции, которую она ранее не видела. Результаты впечатляют: система правильно идентифицировала случаи и контрольные образцы примерно с 98% точностью, значением площади под кривой (AUC) равным 1.0 (почти идеальный показатель) и крайне низкой ошибкой в оценках вероятности. Из этой модели выделили 20 генов, которые внесли наибольший вклад в решения, обозначив короткий список перспективных кандидатов для дальнейшего изучения.

От компьютерных предсказаний к реальным анализам крови

Нахождение генетических шаблонов в больших базах данных полезно лишь в том случае, если эти шаблоны проявляются в реальных людях. Для проверки исследователи собрали кровь у 30 пациентов с аденокарциномой легкого (все — с ранними — средними стадиями болезни и без предыдущего лечения) и 30 здоровых волонтеров, сопоставленных по возрасту и полу. С помощью лабораторного метода ПЦР в реальном времени они измерили экспрессию ряда предсказанных маркерных генов в кровяных клетках. Четыре гена особенно выделялись. CYP2C9, KRT14 и PECAM1 были значительно более активны в крови пациентов по сравнению со здоровыми, тогда как A2M проявлял пониженную активность. Например, уровень CYP2C9 был примерно в четыре раза выше, а KRT14 — примерно в восемь раз выше у пациентов, тогда как A2M был примерно вдвое ниже. Эти отчетливые различия указывают на то, что комбинированный анализ крови по этим маркерам может помочь отличить больных с аденокарциномой легкого от здоровых людей.

Figure 2
Figure 2.

Подсказки об прогнозе и поведении болезни

Исследование вышло за рамки простого ответа «да» или «нет». Связывая активность генов с клиническими данными — размерами опухоли, распространением, стадией и выживаемостью пациентов — команда выявила гены, которые могут предсказывать поведение опухоли. Несколько генов, включая CYP2C9, KCNV1, KRT24, SIRPD, PECAM1 и некодирующий ген LOC730668, были связаны с исходами у пациентов. Некоторые, по‑видимому, связаны с ростом кровеносных сосудов, питающих опухоли, другие — с взаимодействием раковых клеток с иммунной системой или с сопротивляемостью клеточной гибели. Внешние проверки в нескольких независимых наборах данных показали, что большинство этих кандидатов ведут себя последовательно, что повышает уверенность в том, что результаты не являются случайностью одного набора данных.

Что это может означать для пациентов

Проще говоря, эта работа показывает, что разумная комбинация пяти генов — A2M, CYP2C9, KCNV1, KRT24 и SIRPD — может выявлять аденокарциному легкого с высокой чувствительностью в генетических данных, и что по крайней мере четыре из них демонстрируют отчетливые измеримые изменения в крови. Хотя эти маркеры еще не готовы к повседневному скринингу, они представляют собой многообещающую основу для будущих анализов крови, которые могли бы обнаруживать рак легкого на ранних, более излечимых стадиях. Они также могут помочь врачам оценивать агрессивность опухоли и подбирать лечение. Потребуются дальнейшие исследования на больших и более разнообразных группах пациентов, но результаты указывают на то, что искусственный интеллект в сочетании с тщательной лабораторной валидацией может ускорить поиск практичных, минимально инвазивных инструментов в борьбе с раком легкого.

Цитирование: Hossein Zadeh, R., Hossein Zadeh, R., Hajimoradi, M. et al. Identification of diagnostic and prognostic biomarkers in lung adenocarcinoma through integrated bioinformatics analysis and real time PCR validation. Sci Rep 16, 6679 (2026). https://doi.org/10.1038/s41598-026-35971-y

Ключевые слова: аденокарцинома легкого, биомаркеры, глубокое обучение, анализ крови, раннее обнаружение рака