Clear Sky Science · sv

Förklarbar maskininlärning för långtidsprognos av hjärt-kärlsjukdom hos kinesiska medelålders och äldre: en 9-årig longitudinell kohortstudie med webbaserad riskkalkylator

· Tillbaka till index

Varför prognoser för hjärtrisk är viktiga

Hjärt-kärlsjukdom är nu den vanligaste dödsorsaken i Kina, särskilt bland personer i medelåldern och äldre. De flesta verktyg som läkare använder för att uppskatta någons framtida risk för hjärtsjukdom och stroke är dock utvecklade på västerländska populationer och passar inte särskilt väl för kinesiska vuxna. Denna studie undersökte om moderna metoder inom artificiell intelligens kan ge mer exakta, men fortfarande begripliga, långtidsriskuppskattningar anpassade till kinesiska vuxna i åldern 45 år och uppåt.

En nationell genomgång av åldrande hjärtan

Forskarna använde data från China Health and Retirement Longitudinal Study, en stor pågående undersökning som följer tiotusentals vuxna i samhällena över de flesta provinser. Från denna resurs valdes 8 080 personer som var minst 45 år och utan hjärt-kärlsjukdom när de gick in i studien 2011. Dessa deltagare följdes sedan under nio år för att registrera nya fall av hjärtsjukdom och stroke. Teamet började med 77 uppgifter som är enkla att samla in i kliniker, inklusive ålder, region, tidigare sjukdomar, humörsymptom, sömnvanor, kroppsmått och blodprover. Genom standardstatistiska kontroller reducerades detta till 11 nyckelfaktorer som både var praktiska att mäta och starkt kopplade till senare hjärt-kärlhändelser.

Figure 1. Använda data från kinesiska vuxna för att förutsäga vem som har större sannolikhet att utveckla hjärt- eller strokeproblem under det kommande decenniet.
Figure 1. Använda data från kinesiska vuxna för att förutsäga vem som har större sannolikhet att utveckla hjärt- eller strokeproblem under det kommande decenniet.

Att lära datorer att känneteckna mönster

Därefter testade forskarna tio olika datorbaserade prediktionsmetoder, från traditionell logistisk regression till mer flexibla metoder som random forest, gradient boosting och neurala nätverk. Deltagarna delades upp i en träningsgrupp, som användes för att bygga varje modell, och en separat valideringsgrupp, som användes för att testa hur väl modellerna fungerade på nya personer. Prestanda bedömdes utifrån hur noggrant varje metod särskilde dem som senare utvecklade hjärt-kärlsjukdom från dem som förblev fria från den, hur väl predikterade risker överensstämde med faktiska händelsefrekvenser, och hur användbara prediktionerna skulle vara i verkliga beslut om vem som bör få extra förebyggande åtgärder.

Vilka vardagliga faktorer betydde mest

Random forest-metoden visade sig vara bäst och uppnådde hög noggrannhet samt den bästa balansen mellan att upptäcka högriskindivider och undvika falska larm. För att öppna upp metodens inre användes en förklaringsmetod kallad SHAP, som tilldelar varje riskfaktor ett bidrag till den slutliga prediktionen. Denna analys visade att midjemått var den enskilt mest inflytelserika faktorn: varje extra centimeter runt midjan ökade den nioåriga risken märkbart, vilket betonar bukfettets betydelse i denna population. Höga triglyceridnivåer, högre ålder och en tidigare historia av högt blodtryck var också stora riskdrivare, medan högre nivåer av skyddande HDL-kolesterol kopplades till lägre risk. Intressant nog bar också humör och sömnmönster på självständig information: högre depressionspoäng och för lite eller för mycket nattlig sömn ökade båda risken även efter att traditionella medicinska faktorer tagits i beaktande.

Figure 2. Hur midjemått, blodfetter, blodtryck, sömn och humör flödar genom en modell för att signalera högre eller lägre risk för hjärtsjukdom.
Figure 2. Hur midjemått, blodfetter, blodtryck, sömn och humör flödar genom en modell för att signalera högre eller lägre risk för hjärtsjukdom.

Från forskningsmodell till vardagsverktyg

Eftersom alla 11 prediktorer rutinmässigt finns tillgängliga i primärvården, översatte teamet den bäst presterande modellen till en enkel webbaserad kalkylator. Användare anger ålder, region, utvalda medicinska historikposter, midjeomkrets, två vanliga blodfettsmätningar, depressionspoäng och vanlig sömnlängd. Verktyget återger sedan en uppskattning av personens chans att utveckla hjärt-kärlsjukdom under de närmaste nio åren. Författarna betonar att denna kalkylator är avsedd att stödja, inte ersätta, professionellt omdöme och bör användas tillsammans med en full klinisk utvärdering, lokala resurser och patientens preferenser.

Vad detta innebär för patienter och läkare

Studien visar att noggrant utformad och förklarad maskininlärning kan ge mer exakta långtidsuppskattningar av risken för hjärt- och kärlsjukdom för medelålders och äldre kinesiska vuxna än traditionella formler. Den understryker också att vad som händer vid midjan, i blodfetter samt i daglig sömn och humör alla spelar roll för framtida kardiovaskulär hälsa. Genom att paketera dessa insikter i en gratis onlinekalkylator erbjuder arbetet vårdcentraler och individer ett kostnadseffektivt sätt att identifiera högre riskpersoner tidigare och styra skräddarsydda förebyggande strategier, medan slutgiltiga beslut lämnas till klinikerna.

Citering: Zhu, XY., Li, W., Pan, XY. et al. Explainable machine learning for long-term cardiovascular disease risk prediction in Chinese middle-aged and older adults: a 9-year longitudinal cohort study with web-based risk calculator. Sci Rep 16, 14998 (2026). https://doi.org/10.1038/s41598-026-45297-4

Nyckelord: hjärt-kärlsjukdom, maskininlärning, riskprediktion, midjeomkrets, kinesiska vuxna