Clear Sky Science · sv
Multimodal multi-instance learning för prediktion av prestation vid kardiopulmonell ansträngningstestning
Varför detta är viktigt för personer med svaga hjärtan
För personer som lever med hjärtsvikt är en av de största frågorna: ”Hur mycket tid har jag kvar, och vad kan läkare fortfarande göra för mig?” Det bästa medicinska testet för att svara på det i dag är ett krävande test på löpband eller cykel som mäter hur mycket syre kroppen kan använda under hård ansträngning. Men detta test är svårt att få tillgång till och finns inte på många sjukhus. Denna studie visar hur läkare istället skulle kunna använda vanliga hjärtultraljudsundersökningar och information som redan finns i journalen, kombinerat med modern artificiell intelligens, för att uppskatta samma avgörande värde och markera patienter som kan behöva livräddande avancerade behandlingar.
Utmaningen att upptäcka fara i tid
Hjärtsvikt drabbar miljontals människor och stjäl ofta mer än ett decennium av liv. I sitt mest avancerade skede kan överlevnaden vara sämre än för många cancerformer, ändå får bara en liten andel patienter behandlingar som hjärttransplantation eller mekaniska pumpenheter i tid. Ett viktigt verktyg för att avgöra vem som ska remitteras för dessa behandlingar är kardiopulmonell ansträngningstestning, som mäter ”peak VO₂”, den maximala mängd syre kroppen kan använda vid ansträngning. Låg peak VO₂ är en stark varningssignal, men testet kräver specialutrustning, utbildad personal och utrymme, så många centra — särskilt mindre eller landsbygdssjukhus — kan inte erbjuda det. I kontrast är standardiserade hjärtultraljudsundersökningar (transtorakal ekokardiografi, TTE) och elektroniska journaler (EHR) allmänt tillgängliga men har, på egen hand, inte varit särskilt bra på att förutsäga vilka som löper högst risk.
Att lära datorer att läsa över flera tester
Forskarlaget byggde ett nytt system för artificiell intelligens som lär sig från två huvudkällor: rörliga ultraljudsbilder av hjärtat och detaljerade data från den elektroniska journalen, såsom ålder, vikt, mediciner och standardmått på hjärtat. Varje ultraljudsundersökning innehåller många klipp och specialiserade vyer, så istället för att behandla varje bild separat går modellen igenom dem alla tillsammans, mer som en läkare skulle göra. Den använder en ”multi-instance”-strategi: först omvandlas varje bild eller klipp till en kompakt beskrivning, och sedan kombineras dessa med en uppmärksamhetsmekanism som låter modellen fokusera på de mest informativa delarna. Parallellt konverterar ett specialiserat neuralt nätverk, tränat på många typer av tabellformade medicinska data, journalinformationen till sin egen sammanfattning. Ett slutligt fusionssteg blandar ultraljuds- och journal-sammanfattningarna till ett enda patientporträtt, varifrån systemet predikterar peak VO₂ och om personen ligger under en kritisk säkerhetströskel.

Hur väl systemet presterar
Teamet tränade och testade sin metod på data från fyra stora sjukhus i New York–Presbyterian-nätverket, med 1 000 patienter för utveckling och 127 patienter från separata kliniker för extern validering. Jämfört med en tidigare, enklare AI-modell som behandlade ultraljuds- och journaldata mer oberoende, var den nya ramen tydligt mer exakt. Den förklarade cirka 60 % av variationen i peak VO₂ i huvudtestgruppen, jämfört med cirka 53 % tidigare, och dess typiska fel minskade med ungefär en halv metabol ekvivalent (MET), en kliniskt betydelsefull förbättring. När målet enbart var att identifiera hög-riskpatienter — de med särskilt låg ansträngningskapacitet — nådde systemet en area under kurvan på 0,85 i utvecklingsgruppen och 0,87 i de externa sjukhusen, vilket överträffade alla modeller som använde enbart ultraljud eller enbart journaldata. I praktiska termer innebar det att fler verkligt hög-riskpatienter korrekt markerades vid en fast, kliniskt rimlig avvägning mellan missade fall och falsklarm.
Att titta in i svart lådan
För att kontrollera att modellen uppmärksammade vettiga egenskaper skapade författarna visuella kartor över ultraljudsbilderna som visar vilka regioner som mest påverkade prediktionerna. Kartorna tenderade att lyfta fram hjärtrum, deras rörelser och blodflödets vågformer — egenskaper som kardiologer redan förlitar sig på — vilket tyder på att systemet lär sig meningsfulla mönster snarare än brus. I journaldata framträdde mått som ålder, body mass index och vänsterkammarens pumpstyrka som särskilt viktiga, vilket återigen stämmer med kliniska förväntningar. Forskare granskade också hur väl modellen fungerade i olika undergrupper. Prestandan var liknande för män och kvinnor och för vita och icke-vita patienter när det gällde att förutsäga exakt peak VO₂-värde, även om vissa skillnader uppträdde bland äldre vuxna och i klassificeringen av hög risk över raser, vilket understryker behovet av mer diversifierade data och rättviseinriktade förbättringar.

Från forskning till vårdrutin
Eftersom systemet använder information som redan samlas in i rutinvård — standardekokardiogram och befintliga journaldata — skulle det i princip kunna integreras direkt i sjukhusens programvara. Efter att en undersökning avläses skulle AI tyst kunna uppskatta peak VO₂ och markera patienter vars förväntade ansträngningskapacitet är farligt låg, vilket skulle uppmana läkare att beställa formell ansträngningstestning eller remittera dem till specialister på avancerad hjärtsvikt. Studiens resultat, inklusive stark prestanda på sjukhus som inte användes i träningen, tyder på att ett sådant verktyg skulle kunna hjälpa till att fånga fler patienter i nöd som annars kunde förbises. Även om prospektiva prövningar och bredare tester fortfarande behövs, pekar detta arbete mot en framtid där kraftfulla men sällsynta tester kompletteras av AI-system som utnyttjar de data som de flesta sjukhus redan har på ett smartare sätt.
Citering: Huang, Z., Pan, W., Alishetti, S. et al. Multimodal multi-instance learning for cardiopulmonary exercise testing performance prediction. npj Digit. Med. 9, 304 (2026). https://doi.org/10.1038/s41746-026-02493-w
Nyckelord: hjärtsvikt, kardiopulmonell ansträngningstestning, ekokardiografi, artificiell intelligens, riskprediktion