Clear Sky Science · sv
MIMIC-III-Ext-PPG, en PPG-baserad referensdatamängd för kardiovaskulär och respiratorisk signalanalys
Varför handledssensorer kan berätta en livsavgörande historia
Många av oss bär smartklockor som tyst registrerar vår puls dygnet runt. På intensivvårdsavdelningar spelas en mycket liknande ljusburen signal, fotopletismografi eller PPG, in kontinuerligt från svårt sjuka patienter. Denna artikel introducerar MIMIC-III-Ext-PPG, den största och mest detaljerade offentliga samlingen av dessa pulssignaler hittills, utformad för att hjälpa forskare att bygga och testa nya algoritmer för att upptäcka farliga hjärtrytmer, uppskatta blodtryck utan manschett och följa andningen. 
Att ett jättelikt bibliotek av pulssnapshots
Författarna sammanställde mer än 6,3 miljoner korta, 30-sekunders utdrag av PPG-signaler från 6 189 intensivvårdspatienter vars data ingår i den välkända MIMIC-III-sjukhusdatabasen. Varje utdrag fångar hur ljus som passerar genom en fingertopp förändras med varje hjärtslag — en enkel mätning som i dag finns i allt från sängnära monitorer till konsumentbärbara enheter. För många av dessa utdrag innehåller datasettet även synkroniserade elektrokardiogram-, blodtrycks- och andningssignaler, vilket förvandlar varje pulssnapshot till ett rikt, multisignalt fönster mot hjärta och lungor.
Från vårdnots till detaljerade rytm-beteckningar
Det som gör detta dataset särskilt är inte bara dess omfattning, utan dess etiketter. I det ursprungliga journalsystemet noterade sjuksköterskor och läkare regelbundet patientens hjärtrytm i elektroniska journaler. Teamet matchade noggrant dessa journalanteckningar till de exakta tidsintervallen för vågformsinspelningarna och harmoniserade sedan olika registreringssystem till en enhetlig uppsättning om 26 hjärtrytmstyper. Dessa sträcker sig från normal rytm och enkla takykardier eller bradykardier, via olika förmaksoch kammarrytmrubbningar, till pacemakerstyrda rytmer och fullständiga ledningsblock. Denna detaljnivå går långt utöver tidigare pulsbaserade dataset, som vanligtvis bara erbjöd en eller två rytmkategorier.
Mäter mer än bara hjärtslaget
För att stödja en rad studier extraherade författarna en mängd grundläggande vitalparametrar direkt från signalerna. Från blodtrycksvågformerna beräknade de typiska systoliska och diastoliska tryck; från andningssignalen uppskattade de andningsfrekvens; och från elektrokardiogrammet härledde de hjärtfrekvens. Dessa värden beräknades i korta tidsfönster med etablerade öppen källkodsalgoritmer och vedertagna rutiner för att undvika felaktiga mätvärden. Genom att paketera dessa mätningar med varje 30-sekunderssegment tillåter datasettet forskare att testa algoritmer som predicerar blodtryck, hjärtfrekvens eller andningsfrekvens enbart från pulssignalen och att utforska hur dessa målvärden förändras tillsammans.
Säkerställa att signalerna är tillförlitliga
Verklig data från sjukhus kan vara rörig: sensorer lossnar, patienter rör sig och kablar kopplas ur. För att undvika vilseledande analyser byggde teamet en pipeline för signal kvalitet som granskar varje segment. För varje signaltyp kontrollerade de för flacka linjer, saknade värden, orimliga hjärt- eller andningsfrekvenser och inkonsekventa pulsmönster. Segment som klarade alla kontroller markerades som hög kvalitet; de med mindre problem men fortfarande användbar information flaggades som låg kvalitet; och segment med allvarliga problem exkluderades helt. Författarna validerade också en nyckelbetäckning, förmaksflimmer, genom att jämföra den mot expertgranskade EKG-annoteringar från en annan studie och fann hög överensstämmelse och nästan perfekt specificitet. 
En grund för framtida hälsoalgoritmer
Genom att kombinera enorm skala, detaljerade hjärtrytms-etiketter, flera synkroniserade signaler och explicita kvalitetsmått erbjuder MIMIC-III-Ext-PPG en kraftfull testbädd för datadriven medicin. Forskare kan använda den för att jämföra nya metoder för att upptäcka oregelbundna hjärtslag från handledsliknande sensorer, uppskatta blodtryck utan manschett eller bygga multitaskmodeller som lär sig flera vitalparametrar samtidigt. Även om datasettet i sig inte är avsett att ligga till grund för realtidsmedicinska beslut, lägger denna öppna datamängd grunden för mer tillförlitliga och generaliserbara algoritmer som en dag kan förvandla vardagliga pulssensorer till tidiga varningssystem för allvarliga hjärt- och lungproblem.
Citering: Moulaeifard, M., Kutscher, M., Aston, P.J. et al. MIMIC-III-Ext-PPG, a PPG-based Benchmark Dataset for Cardiovascular and Respiratory Signal Analysis. Sci Data 13, 668 (2026). https://doi.org/10.1038/s41597-026-07335-8
Nyckelord: fotopletismografi, arytmidetektion, intensivvårdsdata, blodtrycksestimering, wearable-hälsosensorer