Clear Sky Science · pt

Uma estrutura de inteligência artificial explicável para predição de doença cardíaca isquêmica usando seleção de características com Otimização do Esquilo Aprimorada

· Voltar ao índice

Por que exames cardíacos mais inteligentes importam

As doenças cardíacas continuam sendo a principal causa de morte no mundo, mas os médicos frequentemente precisam conciliar tempo limitado, muitos resultados de exames e ferramentas computacionais complexas. Este estudo mostra como um sistema de inteligência artificial fácil de explicar pode ajudar médicos a identificar precocemente a doença cardíaca isquêmica mantendo sua lógica transparente. Em vez de ocultar decisões em uma caixa-preta, o sistema destaca quais poucas medidas de exames são mais importantes, ajudando os clínicos a usar o suporte computacional sem perder confiança ou controle.

Figure 1. Sistema de IA que, com exames médicos-chave, ajuda médicos a avaliar rapidamente o risco de doença cardíaca de um paciente.
Figure 1. Sistema de IA que, com exames médicos-chave, ajuda médicos a avaliar rapidamente o risco de doença cardíaca de um paciente.

Problemas cardíacos e os dados por trás deles

A doença cardíaca isquêmica ocorre quando o fluxo sanguíneo para o coração é reduzido, frequentemente devido a artérias obstruídas. Os médicos analisam muitas informações, como idade, pressão arterial, colesterol, dor no peito e os resultados de exames cardíacos. O conjunto de dados UCI Heart Disease usado neste trabalho reúne 303 registros de pacientes com 13 desses fatores, além de um rótulo indicando presença ou ausência da doença. Embora essa riqueza de dados auxilie a predição, medidas em excesso, sobrepostas ou pouco úteis podem confundir tanto humanos quanto computadores, retardar a análise e, por vezes, reduzir a acurácia.

Limpeza e enxugamento do prontuário

Antes que um computador aprenda com os dados, os registros brutos precisam ser limpos e reestruturados. Os pesquisadores preencheram números ausentes usando um método que aproveita informações de pacientes semelhantes, escalonaram todas as medidas para uma faixa comum, transformaram categorias textuais — como tipo de dor no peito — em valores numéricos e verificaram cuidadosamente valores incomuns para separar casos extremos reais de prováveis erros. Eles também balancearam as quantidades de pacientes doentes e saudáveis gerando exemplos realistas extras do grupo menor e removeram características quase duplicadas entre si. O resultado é uma tabela organizada onde cada coluna é significativa e pronta para análise.

Como esquilos voadores inspiram a escolha de características

A ideia central do estudo é que o computador não precisa de todas as medidas disponíveis para fazer boas predições. Em vez disso, deve buscar automaticamente um pequeno conjunto das mais informativas. Para isso, os autores usam um método de otimização inspirado em como esquilos voadores procuram alimento na floresta. Em seu procedimento de Otimização do Esquilo Aprimorada, cada “esquilo” representa um possível subconjunto de características, e o grupo desliza coletivamente pelo espaço de busca, ajustando seus movimentos quando o progresso estagna. As combinações de melhor desempenho são mantidas e refinadas, buscando o menor conjunto de medidas que ainda permita decisões altamente precisas.

Figure 2. Medidas selecionadas de exames cardíacos passam por um modelo explicável para classificar pacientes em saudáveis e em risco.
Figure 2. Medidas selecionadas de exames cardíacos passam por um modelo explicável para classificar pacientes em saudáveis e em risco.

Treinando o modelo e abrindo a caixa-preta

Uma vez que a busca inspirada em esquilos seleciona um subconjunto ótimo de características, um modelo Random Forest é treinado para prever quem tem doença cardíaca. Random Forest utiliza muitas árvores de decisão ligeiramente diferentes cujos votos são combinados, tornando a predição final robusta ao ruído dos dados. Nas características escolhidas, o modelo alcança cerca de 96 a 98 por cento de acurácia e uma pontuação muito alta para separar pacientes doentes e saudáveis. Para tornar sua lógica compreensível, os pesquisadores aplicam então duas ferramentas de explicação. Uma, chamada SHAP, mostra quais fatores são mais influentes em todo o conjunto de dados, enquanto a outra, LIME, focaliza pacientes individuais para mostrar como seus valores específicos empurram a predição para maior ou menor risco.

O que isso significa para pacientes e médicos

Em termos simples, o estudo constrói um assistente de predição de doença cardíaca que é ao mesmo tempo preciso e comunicativo. Ao reduzir as entradas a um punhado de medidas-chave e depois usar explicações visuais claras, o sistema pode dizer ao clínico não apenas que um paciente tem probabilidade de ter doença cardíaca isquêmica, mas também quais achados — como um certo resultado de exame ou um nível de alteração relacionada ao exercício — estão impulsionando essa conclusão. Esse equilíbrio entre acurácia, simplicidade e clareza torna a abordagem mais adequada para clínicas reais, e ela poderia ser estendida no futuro para hospitais maiores e fontes de dados mais ricas, como dispositivos vestíveis e exames de imagem.

Citação: Cenitta, D., Arul, N., Arjunan, R.V. et al. An explainable artificial intelligence framework for ischemic heart disease prediction using enhanced squirrel search feature selection. Sci Rep 16, 15422 (2026). https://doi.org/10.1038/s41598-026-46823-0

Palavras-chave: doença cardíaca isquêmica, IA explicável, predição de doença cardíaca, seleção de características, random forest