Clear Sky Science · pt

Avaliação comparativa de estratégias de imputação para dados de séries temporais faltantes em cuidados intensivos usando cenários inspirados no mundo real

2026-02-10 · Voltar ao índice

Por que preencher lacunas de dados importa para pacientes da UTI

Nas unidades de terapia intensiva modernas, cada batida do coração, respiração e pulso da pressão arterial são registrados como um fluxo contínuo de números. Ainda assim, na prática, esses fluxos estão cheios de lacunas: sensores se soltam, pacientes saem do leito para exames e equipamentos são desligados temporariamente. Quando médicos e computadores usam esses registros incompletos para prever o futuro do paciente ou orientar o tratamento, a forma como “preenchermos” essas peças faltantes pode alterar sutilmente a história que os dados contam. Este estudo faz uma pergunta prática com implicações grandes: entre uma ampla gama de estratégias de preenchimento — de linhas retas simples a inteligência artificial de ponta — quais funcionam melhor diante dos tipos de lacunas que realmente ocorrem nas UTIs?

Analisando mais de perto os sinais vitais da UTI

Os pesquisadores utilizaram o MIMIC-IV, um grande banco de dados público de internações na UTI anonimizadas de um hospital dos EUA. Eles focaram em 26.167 internações de adultos e examinaram as primeiras 48 horas após a admissão na UTI, acompanhando quatro sinais vitais monitorados continuamente à beira do leito: frequência cardíaca, saturação de oxigênio, frequência respiratória e pressão arterial média. Para manter os sinais realistas, leituras obviamente impossíveis foram removidas, e todas as medições foram resumidas uma vez por hora. Qualquer hora sem valor registrado para um dado sinal vital foi tratada como ausente. Embora apenas cerca de 4% de todos os valores estivessem ausentes, a equipe constatou que essas lacunas não estavam espalhadas ao acaso — frequentemente se agrupavam mais tarde na janela de 48 horas e às vezes afetavam vários sinais vitais ao mesmo tempo.

Como as lacunas do mundo real foram recriadas

Em vez de inventar padrões puramente artificiais de valores faltantes, os autores construíram três cenários inspirados no que observaram nos dados brutos e no que os clínicos veem à beira do leito. No primeiro, leituras individuais foram deletadas aleatoriamente, simulando medições ocasionalmente perdidas. No segundo, blocos de 1 a 3 horas em todos os quatro sinais vitais desapareceram juntos, representando momentos em que o paciente está afastado dos monitores — por exemplo, durante um exame de imagem. No terceiro, um único sinal vital — por exemplo, a pressão arterial — foi removido por um período contínuo de 4 horas, refletindo um sensor falho ou sonda deslocada. Cada cenário removeu cerca de 30% dos dados, constituindo um teste severo para qualquer método que vise reconstruir as curvas originais.

Velhos truques versus inteligência de máquina moderna

A equipe então confrontou um amplo conjunto de métodos de reconstrução. Recursos simples incluíram preencher cada lacuna com o valor médio do paciente, carrear para frente a última leitura observada, ou traçar uma linha reta entre os pontos conhecidos mais próximos. Ferramentas estatísticas mais avançadas tentaram prever valores faltantes a partir dos outros sinais vitais, mas ao fazê-lo precisaram achatar a dimensão temporal e tratar cada hora como apenas mais uma linha em uma tabela. No outro extremo estavam modelos de aprendizado profundo — Transformers, redes recorrentes e modelos generativos — que aprendem explicitamente padrões ao longo do tempo e entre variáveis. Todos os modelos foram treinados em dados onde 30% dos valores foram ocultados aleatoriamente e, depois, testados em cada um dos três cenários de mascaramento. O desempenho foi avaliado pela distância entre suas reconstruções e os números originais, com atenção especial a erros na pressão arterial média, um sinal crucial para manejo da circulação.

O que funcionou, quando e em que medida

No geral, os modelos mais sofisticados — particularmente uma abordagem baseada em Transformer e uma rede adversarial generativa — apresentaram os menores erros médios, especialmente quando as lacunas eram curtas ou dispersas. Contudo, um método humilde — interpolação por linha reta — teve desempenho surpreendentemente bom, chegando perto desses modelos neurais em muitas situações. Ferramentas estatísticas que ignoravam a ordem das medições, como florestas aleatórias e equações encadeadas, ficaram atrás apesar de sua complexidade. A forma das lacunas também importou. Quando os valores estavam faltando ao acaso, todos os métodos pareceram melhores, oferecendo uma visão otimista demais de sua precisão. Buracos longos e contínuos no registro, especialmente ao longo de várias horas ou em um único sensor falho, provaram ser muito mais difíceis de preencher corretamente. Nesses cenários mais desafiadores, os melhores métodos de aprendizado profundo degradaram-se de forma mais gradual do que abordagens simples, mas os ganhos frequentemente foram modestos quando traduzidos para unidades reais de pressão arterial.

Por que os achados importam para decisões à beira do leito

Para faixas de pressão arterial do dia a dia, a diferença entre os melhores modelos de aprendizado profundo e a interpolação direta foi frequentemente apenas alguns milímetros de mercúrio — tipicamente pequena demais para alterar a decisão de um médico. Ainda assim, todos os métodos, incluindo os mais avançados, apresentaram dificuldades quando a pressão arterial estava muito baixa ou muito alta — justamente os momentos em que o monitoramento cuidadoso é mais importante. O estudo conclui que escolher como lidar com dados faltantes na UTI tem tanto a ver com entender como e onde as lacunas ocorrem quanto com escolher o algoritmo mais recente. Modelos sofisticados podem oferecer ganhos incrementais, particularmente para lacunas mais longas ou complexas, mas métodos simples e transparentes podem ser mais do que adequados para muitos usos práticos. Crucialmente, preencher lacunas melhor não garante automaticamente modelos preditivos melhores; trabalhos futuros precisam testar como essas escolhas de reconstrução repercutem nas decisões clínicas reais.

Citação: Poette, M., Mouysset, S., Ruiz, D. et al. Benchmarking imputation strategies for missing time-series data in critical care using real-world-inspired scenarios. Sci Rep 16, 8116 (2026). https://doi.org/10.1038/s41598-026-39035-z

Palavras-chave: Séries temporais de UTI, dados faltantes, métodos de imputação, aprendizado profundo, sinais vitais