Clear Sky Science · pt
Previsão do estágio do câncer de pulmão no diagnóstico com base em sintomas autorreferidos e fatores de fundo usando modelos de aprendizado de máquina
Por que é tão difícil identificar o câncer de pulmão cedo
O câncer de pulmão é um dos mais letais em grande parte porque costuma ser detectado tardiamente, quando as opções de tratamento são limitadas. Ainda assim, muitas pessoas com câncer de pulmão apresentam sintomas antes e no momento do diagnóstico — como tosse, falta de ar, cansaço ou perda de peso — que, em teoria, poderiam alertar os médicos mais cedo. Este estudo fez uma pergunta simples, mas importante: se os pacientes relatassem sistematicamente seus sintomas e informações de contexto em detalhe, os computadores conseguiriam aprender a identificar quem provavelmente tem câncer de pulmão e se ele está em estágio inicial ou avançado?

Ouvindo as próprias histórias dos pacientes
Os pesquisadores acompanharam 486 pessoas encaminhadas a uma clínica especializada em Estocolmo porque seus médicos suspeitavam de câncer de pulmão. Todos preencheram um questionário eletrônico detalhado em um tablet chamado PEX-LC. Ele indagava sobre 57 fatores de contexto (como idade, tabagismo, situação domiciliar e doenças pulmonares prévias) e mais de 100 sintomas possíveis, desde problemas respiratórios e tosse até dor, fadiga, alterações de apetite e febre. As perguntas capturaram não apenas os primeiros sinais de alerta, mas também quais sintomas estavam presentes por volta da época do diagnóstico. No ano seguinte, os prontuários médicos revelaram quem foi diagnosticado com câncer de pulmão e se estava em estágio não avançado (principalmente estágios I–IIIa) ou avançado (IIIb–IV).
Quem acabou tendo câncer de pulmão
Das pessoas encaminhadas, cerca de quatro em cada dez não tinham câncer, enquanto seis em cada dez receberam diagnóstico de câncer de pulmão, dividido aproximadamente entre estágios não avançados e avançados. Em comparação com os sem câncer, os pacientes com câncer de pulmão tendiam a ser mais velhos, tinham maior probabilidade de fumar diariamente, de morar sozinhos e de ter perdido peso no ano anterior. Entre aqueles com doença em estágio avançado, houve predominância de homens, e condições pulmonares prévias como asma, doença pulmonar obstrutiva crônica e pneumonia foram mais comuns. Esses padrões de contexto sugerem que fatores cotidianos — idade, histórico de tabagismo, situação de moradia e mudanças recentes na saúde — permanecem sinais fortes de risco, mesmo antes de focar em sintomas específicos.
Sintomas que se destacam
Quando a equipe comparou os sintomas relatados, observou que pessoas com câncer de pulmão em estágio inicial pareciam surpreendentemente semelhantes às sem câncer: apenas um som respiratório sibilante e a ausência de febre se destacaram claramente em comparações simples um a um. Em contraste, os com câncer de pulmão em estágio avançado apresentaram muito mais queixas distintivas. Eles reportaram com maior frequência falta de ar, ofegância, tosse irritativa e respiração ruidosa, assim como dor (especialmente nas costas), fadiga intensa, fraqueza, calafrios e problemas para comer, como saciedade precoce e perda de apetite. Esses padrões confirmam que, quando o câncer de pulmão está avançado, costuma afetar múltiplos sistemas do corpo, enquanto a doença inicial pode se ocultar atrás de sensações vagos ou facilmente descartadas.

O que os computadores puderam e não puderam fazer
Para verificar se combinações complexas de respostas poderiam dar um sinal mais claro do que qualquer sintoma isolado, os pesquisadores treinaram vários tipos de modelos de aprendizado de máquina. Esses algoritmos aprenderam a partir de 129 variáveis diferentes do questionário a separar pessoas com câncer não avançado daquelas sem câncer, e separadamente a distinguir câncer avançado de ausência de câncer. Os modelos alcançaram apenas precisão moderada: foram melhores do que o acaso, mas estavam longe do ideal, especialmente para a doença em estágio inicial. Fatores de contexto como idade, status de tabagismo, sexo e morar sozinho figuraram consistentemente entre os preditores mais influentes. Alguns sintomas — tosse irritativa, respiração sibilante ou ruidosa, ofegância, aperto na garganta, dor e alterações no apetite ou no peso — também contribuíram, particularmente para o câncer avançado. No entanto, nenhum pequeno conjunto de sintomas dominou; em vez disso, dezenas de características sutis precisaram ser combinadas para alcançar um desempenho modesto.
O que isso significa para pacientes e médicos
O estudo mostra que simplesmente perguntar às pessoas em detalhe sobre seus sintomas e circunstâncias de vida pode revelar padrões significativos ligados ao câncer de pulmão, mas que esses sinais costumam ser fracos, especialmente em estágios iniciais, quando o tratamento tem maior chance de cura. Modelos de aprendizado de máquina baseados apenas em dados de questionários podem ajudar a identificar quais pacientes encaminhados precisam de investigação mais urgente, mas não são precisos o suficiente para substituir triagens ou testes diagnósticos. Para pacientes e clínicos, a principal conclusão é que idade, tabagismo, morar sozinho e perda de peso recente, combinados com problemas respiratórios persistentes, dor, perda de apetite ou fadiga inexplicada, devem reduzir o limiar para exames pulmonares completos. Os autores argumentam que o futuro da detecção precoce do câncer de pulmão provavelmente virá da integração dessas informações autorreferidas com dados clínicos e testes biológicos, em vez de depender apenas dos sintomas.
Citação: Gustavell, T., Sissala, N., Pernemalm, M. et al. Predicting lung cancer stage at diagnosis based on self-reported symptoms and background factors using machine learning models. Sci Rep 16, 11866 (2026). https://doi.org/10.1038/s41598-026-46710-8
Palavras-chave: câncer de pulmão, detecção precoce, sintomas relatados pelo paciente, aprendizado de máquina, avaliação de risco