Clear Sky Science · pt

Avaliação da saúde cardíaca em diferentes cenários e dispositivos usando um modelo fundamental multimodal pré-treinado com dados de 1,7 milhão de indivíduos

· Voltar ao índice

Por que os dados do seu batimento importam

De monitores hospitalares a smartwatches, cada vez mais aspectos da nossa vida são rastreados por pequenos sinais elétricos e ópticos do coração. Esses registros podem detectar ritmos perigosos, estimar a pressão arterial sem manguito e até indicar risco cardíaco futuro. Mas, como dispositivos e contextos variam muito, os algoritmos atuais frequentemente funcionam bem apenas nas situações específicas para as quais foram desenvolvidos. Este estudo apresenta um novo tipo de modelo “fundamental” para sinais cardíacos que busca compreender a saúde do coração em vários dispositivos, países e casos de uso ao mesmo tempo.

Figure 1
Figure 1.

Muitas maneiras de ouvir o coração

Médicos e aparelhos podem “ouvir” o coração de formas distintas. O exame clássico de hospital é o eletrocardiograma (ECG) de 12 derivações, com adesivos colocados no tórax e nos membros para registrar a atividade elétrica do coração de ângulos diferentes. Unidades de terapia intensiva costumam usar menos derivações além de um sensor óptico chamado fotopletismograma (PPG), que ilumina a pele para acompanhar o pulso do sangue nos vasos. Em casa, smartwatches e patches podem registrar apenas um canal de ECG ou somente PPG. Cada configuração produz sinais com formas, durações e números de canais diferentes, o que dificulta construir um único modelo que funcione em todos os contextos. Abordagens tradicionais normalmente treinam algoritmos separados e feitos sob medida para cada dispositivo e tarefa, e eles têm dificuldade quando levados a ambientes ou populações novas.

Um único “cérebro” para vários sinais cardíacos

Os pesquisadores projetaram um modelo fundamental de detecção cardíaca, ou CSFM, para agir como um cérebro comum para todos esses sinais. Em vez de aprender a partir de um único conjunto de dados organizado, o CSFM foi treinado em uma coleção enorme e heterogênea: cerca de 1,7 milhão de registros cardíacos de múltiplos hospitais e países, incluindo formas de onda de ECG e PPG além dos relatórios textuais que médicos ou máquinas geraram sobre eles. O modelo divide os sinais em segmentos curtos, transforma tanto sinais quanto palavras em tokens e os alimenta em um transformer, um tipo de arquitetura de aprendizado profundo que impulsionou avanços recentes em linguagem e visão. Durante o treinamento, grandes porções dos tokens são deliberadamente ocultadas, e o modelo aprende a reconstruir as partes faltantes. Esse treinamento “mascarado” força o CSFM a capturar os padrões essenciais compartilhados entre diferentes dispositivos, derivações e linguagens de descrição.

Do diagnóstico à pressão arterial e além

Uma vez treinado, o CSFM pode ser adaptado a diversas tarefas concretas usando conjuntos de dados rotulados relativamente pequenos. A equipe o testou em classificação de ritmos e doenças cardíacas usando ECGs padrão de 12 derivações, ECGs vestíveis de derivação única e PPG de smartwatches. Ele não apenas igualou, mas frequentemente superou redes profundas específicas de tarefa. O CSFM também ajudou a estimar idade, sexo e índice de massa corporal diretamente a partir de trechos breves de ECG e PPG, demonstrando que havia assimilado pistas sutis sobre a pessoa, não apenas sobre o batimento. Em outro conjunto de experimentos, o modelo converteu ECG e PPG em formas de onda contínuas de pressão arterial e, em seguida, em valores sistólicos e diastólicos, produzindo estimativas sem manguito mais precisas do que métodos concorrentes.

Figure 2
Figure 2.

Funcionando entre dispositivos e preenchendo lacunas

Um teste especialmente importante foi verificar se o CSFM conseguiria lidar com situações em que apenas um subconjunto da informação habitual está disponível. Os pesquisadores mostraram que modelos ajustados a partir do CSFM funcionavam bem tanto ao ver todas as 12 derivações do ECG, quanto seis derivações, duas derivações comuns ou até uma única derivação. Testaram também combinações de entradas somente ECG, somente PPG e ECG mais PPG. Nesses cenários, sistemas baseados em CSFM se mantiveram robustos enquanto modelos convencionais pioravam de forma mais acentuada. As representações internas do modelo puderam ainda ser usadas como características prontas para ferramentas simples, como árvores com reforço de gradiente, frequentemente alcançando desempenho similar ao de redes profundas completamente afinadas. Por fim, ao adicionar uma cabeça de regressão, o CSFM pôde gerar um tipo de sinal a partir de outro — por exemplo, produzindo um ECG realista a partir de um traçado de PPG, ou reconstruindo um ECG de 12 derivações completo a partir de uma única derivação — abrindo caminho para aumento de dados e melhor análise quando gravações ideais não estão disponíveis.

O que isso pode significar para os pacientes

Para não especialistas, a mensagem central é que um único modelo de uso geral pode agora interpretar gravações cardíacas muito diferentes e ainda fornecer respostas precisas e clinicamente úteis. Em vez de construir um algoritmo frágil por dispositivo e hospital, o CSFM oferece uma base compartilhada que pode ser adaptada de forma leve às necessidades locais, desde identificar ritmos perigosos em um smartwatch até prever quais pacientes têm maior risco de morte em um ano. Os autores reconhecem questões em aberto, como tornar as decisões do modelo mais fáceis de interpretar pelos clínicos e reduzir suas exigências computacionais. Ainda assim, os resultados sugerem que modelos fundamentais para sinais cardíacos podem ajudar a levar monitoramento cardíaco avançado e previsão de risco a mais pessoas, em mais lugares, usando os dispositivos que elas já possuem.

Citação: Gu, X., Tang, W., Han, J. et al. Cardiac health assessment across scenarios and devices using a multimodal foundation model pretrained on data from 1.7 million individuals. Nat Mach Intell 8, 220–233 (2026). https://doi.org/10.1038/s42256-026-01180-5

Palavras-chave: modelo fundamental cardíaco, eletrocardiograma, fotopletismografia, cardiologia digital, monitoramento cardíaco vestível