Clear Sky Science · pt

Previsão de sobrevida entre diferentes cânceres usando modelos de aprendizado de máquina

· Voltar ao índice

Por que prever a sobrevida do câncer de novas maneiras importa

Pacientes com câncer e suas famílias frequentemente fazem uma pergunta simples, porém angustiante: “Quanto tempo me resta?” Os médicos tentam responder com base em sua experiência e em dados passados, mas para muitos cânceres mais raros simplesmente não há casos semelhantes suficientes para orientar previsões precisas. Este estudo investiga se programas de computador modernos podem "emprestar experiência" de cânceres comuns para ajudar a prever a sobrevida em cânceres menos frequentes, potencialmente oferecendo a mais pacientes expectativas mais claras e um cuidado mais ajustado.

Figure 1
Figure 1.

Usando pacientes passados para orientar o cuidado futuro

Os pesquisadores trabalharam com um grande repositório de informações do mundo real vindas de registros hospitalares de câncer em São Paulo, Brasil. Esses registros cobrem mais de um milhão de pacientes tratados entre 2000 e 2019 e incluem detalhes como idade, estadiamento do tumor, tratamentos recebidos e se a pessoa estava viva três anos após o diagnóstico. Focar nesse marco de três anos permitiu à equipe comparar cânceres com expectativas de vida típicas muito diferentes, evitando dados extremamente desequilibrados, nos quais quase todos ou sobrevivem ou morrem.

Ensinando computadores a identificar padrões de sobrevida

Para transformar esse registro em uma ferramenta de previsão, os autores usaram dois métodos de aprendizado de máquina populares, XGBoost e LightGBM. Esses métodos não tentam entender a biologia diretamente; em vez disso, vasculham milhares de históricos de pacientes para encontrar padrões que liguem características como estágio da doença e momento do tratamento à sobrevida posterior. Primeiro, a equipe construiu modelos “especialistas”, cada um treinado apenas em um tipo de câncer, como mama, pulmão ou estômago. Em seguida, eles verificaram quão bem esses modelos podiam prever a sobrevida em três anos para novos pacientes com o mesmo câncer, usando medidas padrão que equilibram a identificação correta de sobreviventes e não sobreviventes.

Um câncer pode ajudar a prever outro?

O cerne do estudo faz uma pergunta ousada: um modelo treinado em um tipo de câncer pode prever com sucesso a sobrevida em um câncer diferente? Para testar isso, os pesquisadores agruparam os cânceres de duas maneiras: os cânceres mais comuns (pele, mama, próstata, colorretal, pulmão e colo do útero) e os cânceres do sistema digestivo (boca, orofaringe, esôfago, estômago, intestino delgado, colorretal e ânus). Em uma primeira fase, eles treinaram modelos separados para cada câncer e os testaram nos demais, selecionando apenas os pares em que tanto sobrevida quanto não sobrevida eram previstos com equilíbrio razoável. Em fases posteriores, mesclaram dados de cânceres selecionados em conjuntos de treino compartilhados, criando modelos mais gerais que tiravam proveito de padrões comuns entre tumores relacionados.

Figure 2
Figure 2.

Onde o aprendizado entre cânceres ajuda — e onde não ajuda

Para os cânceres comuns, combinar dados entre tipos não superou os melhores modelos especialistas. Um único modelo treinado nos seis cânceres comuns, por exemplo, previu com menos precisão do que modelos ajustados para cada câncer individualmente. A história foi diferente para alguns cânceres do sistema digestivo. Quando dados de cânceres da cavidade oral, esôfago e estômago foram agrupados, o modelo resultante previu a sobrevida em três anos para o câncer de estômago ligeiramente melhor do que o modelo treinado apenas com estômago, com acurácia balanceada pouco acima de 80%. Entretanto, testes estatísticos mostraram que essa melhoria não foi claramente distinta do acaso, o que significa que o modelo compartilhado e o modelo especialista estavam essencialmente empatados. Resultados semelhantes de “quase, mas não claramente melhores” apareceram para cânceres da cavidade oral, intestino delgado e colorretal, frequentemente com compromissos entre identificar corretamente sobreviventes versus não sobreviventes.

O que isso significa para pacientes com cânceres raros

Ainda que modelos entre cânceres raramente superassem os melhores modelos específicos de doença, muitas vezes chegaram perto — usando apenas informações emprestadas de outros tipos de câncer. Para cânceres raros que carecem de grandes conjuntos de dados de alta qualidade, isso é um sinal encorajador: no futuro, médicos podem apoiar-se em modelos treinados em cânceres mais comuns para oferecer estimativas de sobrevida significativas quando ferramentas especialistas são impossíveis de construir. Os autores alertam que esses métodos ainda não estão prontos para uso clínico rotineiro, e que devem ser testados em outras regiões e combinados com dados biológicos mais profundos. Ainda assim, o trabalho aponta para um futuro em que nenhum paciente fica sem orientação simplesmente porque seu câncer é incomum.

Citação: Cardoso, L.B., Egydio, J.E., Toporcov, T.N. et al. Cross-cancer survival prediction using machine learning models. Sci Rep 16, 9623 (2026). https://doi.org/10.1038/s41598-025-34133-w

Palavras-chave: previsão de sobrevida no câncer, aprendizado de máquina em oncologia, modelagem entre cânceres, cânceres raros, registros clínicos