Clear Sky Science · pt
MIMIC-III-Ext-PPG, um conjunto de dados de referência baseado em PPG para análise de sinais cardiovasculares e respiratórios
Por que sensores de pulso no pulso podem contar uma história de vida ou morte
Muitos de nós usamos smartwatches que monitoram silenciosamente nosso pulso dia e noite. Em unidades de terapia intensiva, um sinal muito semelhante baseado em luz, chamado fotopletismografia, ou PPG, é registrado ininterruptamente de pacientes criticamente enfermos. Este artigo apresenta o MIMIC-III-Ext-PPG, a maior e mais detalhada coleção pública desses sinais de pulso até o momento, criada para ajudar pesquisadores a desenvolver e testar novos algoritmos para identificar ritmos cardíacos perigosos, estimar pressão arterial sem um manguito e monitorar a respiração. 
Uma biblioteca gigante de instantâneos de pulso
Os autores reuniram mais de 6,3 milhões de trechos curtos de 30 segundos de sinais PPG de 6.189 pacientes de terapia intensiva cujos dados fazem parte do conhecido banco de dados hospitalar MIMIC-III. Cada trecho captura como a luz que atravessa uma ponta de dedo varia a cada batida do coração, uma medida simples que hoje está disponível em tudo, desde monitores à beira do leito até dispositivos vestíveis de consumo. Para muitos desses trechos, o conjunto de dados também inclui sinais sincronizados de eletrocardiograma, pressão arterial e respiração, transformando cada instantâneo de pulso em uma janela rica e multi-sinal sobre o coração e os pulmões.
Das anotações à beira do leito a rótulos detalhados de ritmo cardíaco
O que diferencia este conjunto de dados não é apenas seu tamanho, mas seus rótulos. No sistema hospitalar original, enfermeiros e médicos registravam regularmente o ritmo cardíaco do paciente em prontuários eletrônicos. A equipe correspondeu cuidadosamente essas entradas de prontuário aos tempos exatos cobertos pelas gravações de formas de onda e depois harmonizou diferentes sistemas de registro em um único e consistente conjunto de 26 tipos de ritmo cardíaco. Esses tipos vão desde ritmo normal e simples acelerações ou desacelerações, passando por diversas arritmias atriais e ventriculares, até ritmos gerados por marcapasso e bloqueios completos de condução. Esse nível de detalhe vai muito além de conjuntos de dados anteriores baseados em pulso, que geralmente ofereciam apenas uma ou duas categorias de ritmo.
Medindo mais do que apenas a batida do coração
Para suportar uma variedade de estudos, os autores extraíram uma série de sinais vitais básicos diretamente dos sinais. Das formas de onda de pressão arterial calcularam as pressões típicas de pico e de base; do sinal de respiração estimaram a taxa respiratória; e do eletrocardiograma derivaram a frequência cardíaca. Esses valores foram calculados em janelas de tempo curtas, usando algoritmos de código aberto já estabelecidos e regras de melhores práticas para evitar leituras espúrias. Ao empacotar essas medições com cada segmento de 30 segundos, o conjunto de dados permite que pesquisadores testem algoritmos que predizem pressão arterial, frequência cardíaca ou taxa respiratória apenas a partir do sinal de pulso, e explorem como esses alvos variam em conjunto.
Garantindo que os sinais sejam confiáveis
Dados hospitalares do mundo real podem ser bagunçados: sensores caem, pacientes se movem e cabos se desconectam. Para evitar análises enganosas, a equipe construiu um pipeline de qualidade de sinal que filtra cada segmento. Para cada tipo de sinal, verificaram linhas planas, valores ausentes, frequências cardíacas ou respiratórias implausíveis e formas de batida inconsistentes. Segmentos que passaram em todas as verificações foram marcados como alta qualidade; aqueles com problemas menores, mas ainda com informação utilizável, foram rotulados como baixa qualidade; e segmentos com problemas graves foram excluídos inteiramente. Os autores também validaram um rótulo chave, fibrilação atrial, comparando-o com anotações de eletrocardiograma revisadas por especialistas de outro estudo, encontrando alta concordância e especificidade quase perfeita. 
Uma base para algoritmos de saúde futuros
Ao combinar grande escala, rótulos detalhados de ritmo cardíaco, múltiplos sinais sincronizados e escores explícitos de qualidade, o MIMIC-III-Ext-PPG oferece um potente campo de testes para medicina orientada a dados. Pesquisadores podem usá-lo para comparar novos métodos de detecção de batimentos cardíacos irregulares a partir de sensores semelhantes aos de pulso no pulso, estimar pressão arterial sem manguito ou construir modelos multitarefa que aprendam vários sinais vitais ao mesmo tempo. Embora não se destine a orientar decisões médicas em tempo real por si só, esse conjunto de dados aberto lança as bases para algoritmos mais confiáveis e generalizáveis que, um dia, poderão transformar sensores de pulso comuns em sistemas de alerta precoce para problemas sérios do coração e dos pulmões.
Citação: Moulaeifard, M., Kutscher, M., Aston, P.J. et al. MIMIC-III-Ext-PPG, a PPG-based Benchmark Dataset for Cardiovascular and Respiratory Signal Analysis. Sci Data 13, 668 (2026). https://doi.org/10.1038/s41597-026-07335-8
Palavras-chave: fotopletismografia, detecção de arritmia, dados de unidade de terapia intensiva, estimativa da pressão arterial, sensores de saúde vestíveis