Clear Sky Science · ru

Прогнозирование стадии рака лёгкого на момент постановки диагноза на основе самоотчётов о симптомах и фоновых факторах с помощью моделей машинного обучения

· Назад к списку

Почему так трудно обнаружить рак лёгкого на ранней стадии

Рак лёгкого — одно из самых смертоносных онкологических заболеваний, во многом потому, что его часто обнаруживают слишком поздно, когда возможности лечения ограничены. Тем не менее многие пациенты с раком лёгкого действительно имеют симптомы до и во время постановки диагноза — такие как кашель, одышка, усталость или потеря веса — которые теоретически могли бы предупредить врачей раньше. В этом исследовании поставили простой, но важный вопрос: если пациенты систематически подробно сообщают о своих симптомах и фоновых данных, смогут ли компьютеры научиться определять, у кого с большой вероятностью есть рак лёгкого и на ранней он стадии или на поздней?

Figure 1
Figure 1.

Слушая истории самих пациентов

Исследователи наблюдали 486 человек, направленных в специализированную клинику в Стокгольме по подозрению на рак лёгкого. Все заполнили подробный электронный опросник на планшете под названием PEX-LC. В нём учитывались 57 фоновых факторов (таких как возраст, курение, условия проживания и перенесённые болезни лёгких) и более 100 возможных симптомов — от проблем с дыханием и кашля до боли, усталости, изменений аппетита и лихорадки. Вопросы фиксировали не только самые первые признаки, но и какие симптомы присутствовали в период около постановки диагноза. В течение следующего года медицинские записи показали, у кого был подтверждён рак лёгкого и был ли он нераспространённой стадии (в основном стадии I–IIIa) или распространённой (IIIb–IV).

Кто в итоге оказался с раком лёгкого

Из направленных примерно четыре из десяти не имели рака, тогда как шесть из десяти получили диагноз рак лёгкого, примерно поровну распределившись между нераспространённой и распространённой стадиями. По сравнению с теми, у кого рака не было, пациенты с раком лёгкого были в среднем старше, чаще ежедневно курили, чаще жили в одиночестве и чаще теряли вес в предшествующий год. Среди пациентов с распространённой стадией мужчин было больше в сравнении с другими, а также чаще встречались предшествующие заболевания лёгких — астма, хроническая обструктивная болезнь лёгких и пневмония. Эти фоновые различия указывают на то, что повседневные факторы — возраст, история курения, условия проживания и недавние изменения в здоровье — остаются мощными индикаторами риска, даже прежде чем обращать внимание на конкретные симптомы.

Симптомы, которые выделяются

При сравнении сообщённых симптомов выяснилось, что люди с ранней стадией рака лёгкого удивительно похожи на тех, у кого рака нет: в простых попарных сравнениях лишь свистящее дыхание и отсутствие лихорадки чётко их отличали. Напротив, у пациентов с распространённой стадией рака было гораздо больше характерных жалоб. Они чаще отмечали одышку, задыхание, раздражающий кашель и шумное дыхание, а также боль (особенно в спине), выраженную усталость, слабость, озноб и проблемы с приёмом пищи — раннее насыщение и потерю аппетита. Эти закономерности подтверждают, что к моменту распространённой стадии рак лёгкого зачастую затрагивает несколько систем организма, тогда как раннее заболевание может скрываться за расплывчатыми или легко проигнорированными ощущениями.

Figure 2
Figure 2.

Что компьютеры смогли и не смогли сделать

Чтобы выяснить, смогут ли сложные сочетания ответов дать более чёткую картину, чем любой отдельный симптом, исследователи обучили несколько типов моделей машинного обучения. Эти алгоритмы учились на 129 различных переменных опросника разделять людей с нераспространённым раком и тех, у кого рака нет, и отдельно отличать распространённый рак от отсутствия рака. Модели показали лишь умеренную точность: они работали лучше случайного угадывания, но были далеко не идеальными, особенно для ранней стадии. Фоновые факторы — возраст, статус курения, пол и жизнь в одиночестве — стабильно находились среди самых влиятельных предикторов. Некоторые симптомы — раздражающий кашель, свистящее или шумное дыхание, задыхание, ощущение сжатия в горле, боль и изменения аппетита или веса — также вносили вклад, особенно для распространённого рака. Однако не было небольшой группы симптомов, доминировавшей над остальными; наоборот, для достижения скромного уровня прогноза приходилось сочетать десятки тонких признаков.

Что это значит для пациентов и врачей

Исследование показывает, что простая детальная анкета о симптомах и жизненных обстоятельствах может выявить значимые шаблоны, связанные с раком лёгкого, но эти сигналы часто слабы, особенно на ранних стадиях, когда шансы на излечение наибольшие. Модели машинного обучения, использующие только данные опросника, могут помочь отобрать направленных пациентов, которым требуется особенно срочное обследование, но они недостаточно точны, чтобы заменять скрининг или диагностические тесты. Для пациентов и врачей главный вывод таков: возраст, курение, жизнь в одиночестве и недавняя потеря веса в сочетании с постоянными проблемами дыхания, болью, потерей аппетита или необъяснимой усталостью должны понижать порог для тщательной проверки лёгких. Авторы утверждают, что будущее более раннего обнаружения рака лёгкого, вероятно, будет связано с объединением таких самоотчётных данных с клинической информацией и биологическими тестами, а не с опорой только на симптомы.

Цитирование: Gustavell, T., Sissala, N., Pernemalm, M. et al. Predicting lung cancer stage at diagnosis based on self-reported symptoms and background factors using machine learning models. Sci Rep 16, 11866 (2026). https://doi.org/10.1038/s41598-026-46710-8

Ключевые слова: рак лёгкого, раннее обнаружение, симптомы, сообщаемые пациентом, машинное обучение, оценка риска