Clear Sky Science · de

Erklärbares maschinelles Lernen zur Vorhersage des langfristigen Risikos für Herz-Kreislauf-Erkrankungen bei chinesischen Mittelalten und Älteren: eine 9-jährige longitudinale Kohortenstudie mit webbasierendem Risikorechner

· Zurück zur Übersicht

Warum die Vorhersage des Herzrisikos wichtig ist

Kardiovaskuläre Erkrankungen sind inzwischen die häufigste Todesursache in China, insbesondere bei Menschen im mittleren und höheren Alter. Die meisten Instrumente, die Ärzte zur Abschätzung des zukünftigen Risikos für Herz-Kreislauf-Ereignisse verwenden, wurden jedoch an westlichen Populationen entwickelt und passen nicht gut zu chinesischen Erwachsenen. Diese Studie prüfte, ob moderne Methoden der künstlichen Intelligenz genauere, aber weiterhin verständliche Langzeit-Risikoschätzungen liefern können, die auf chinesische Erwachsene ab 45 Jahren zugeschnitten sind.

Ein landesweiter Blick auf alternde Herzen

Die Forschenden nutzten die China Health and Retirement Longitudinal Study, eine große laufende Erhebung, die Zehntausende von in der Gemeinde lebenden Erwachsenen in den meisten Provinzen begleitet. Aus dieser Datenquelle wählten sie 8.080 Personen im Alter von mindestens 45 Jahren aus, die 2011 zu Studienbeginn keine kardiovaskulären Erkrankungen hatten. Diese Teilnehmenden wurden anschließend neun Jahre lang verfolgt, um neue Fälle von Herzkrankheiten und Schlaganfällen zu erfassen. Das Team begann mit 77 leicht in der Praxis zu erfassenden Merkmalen, darunter Alter, Region, Vorerkrankungen, Stimmungssymptome, Schlafgewohnheiten, Körpermaße und Blutwerte. Mit standardisierten statistischen Prüfungen reduzierten sie dies auf 11 Schlüsselfaktoren, die sowohl praktisch messbar als auch stark mit späteren kardiovaskulären Ereignissen verbunden waren.

Figure 1. Verwendung von Daten chinesischer Erwachsener, um vorherzusagen, wer in den nächsten zehn Jahren eher Herz- oder Schlaganfallprobleme entwickeln wird.
Figure 1. Verwendung von Daten chinesischer Erwachsener, um vorherzusagen, wer in den nächsten zehn Jahren eher Herz- oder Schlaganfallprobleme entwickeln wird.

Computern beibringen, Muster zu erkennen

Anschließend testeten die Forschenden zehn verschiedene computerbasierte Vorhersagemethoden, von der klassischen logistischen Regression bis zu flexibleren Ansätzen wie Random Forests, Gradient Boosting und neuronalen Netzwerken. Die Teilnehmenden wurden in eine Trainingsgruppe, zur Modellbildung, und eine separate Validierungsgruppe, zur Prüfung der Übertragbarkeit auf neue Personen, aufgeteilt. Die Leistungsbewertung basierte darauf, wie genau jede Methode diejenigen trennte, die später eine kardiovaskuläre Erkrankung entwickelten, von denen, die gesund blieben, wie gut die prognostizierten Risiken mit den tatsächlichen Ereignisraten übereinstimmten und wie nützlich die Vorhersagen für reale Entscheidungen darüber wären, wer zusätzliche Präventionsmaßnahmen erhalten sollte.

Welche alltäglichen Faktoren am wichtigsten waren

Die Random-Forest-Methode schnitt am besten ab und erreichte eine starke Genauigkeit sowie das beste Gleichgewicht zwischen dem Erfassen von Hochrisikopersonen und dem Vermeiden von Fehlalarmen. Um die Funktionsweise dieses Verfahrens offen zu legen, nutzte das Team eine Erklärmethode namens SHAP, die jedem Risikofaktor einen Beitrag zur endgültigen Vorhersage zuweist. Diese Analyse zeigte, dass der Taillenumfang der einflussreichste Einzelparameter war: Jeder zusätzliche Zentimeter um die Taille erhöhte das 9-Jahres-Risiko spürbar und betont damit die Bedeutung des Bauchfetts in dieser Population. Hohe Triglyzeridwerte, höheres Alter und eine Vorgeschichte von Bluthochdruck waren ebenfalls wichtige Risikotreiber, während höhere Werte des schützenden HDL-Cholesterins mit geringerem Risiko verknüpft waren. Interessanterweise lieferten Stimmung und Schlafmuster unabhängige Informationen: Höhere Depressionswerte und sowohl zu wenig als auch zu viel nächtlicher Schlaf erhöhten das Risiko, selbst nach Berücksichtigung traditioneller medizinischer Faktoren.

Figure 2. Wie Taillenumfang, Blutfette, Blutdruck, Schlaf und Stimmung durch ein Modell laufen, um auf ein höheres oder niedrigeres Herz-Kreislauf-Risiko hinzuweisen.
Figure 2. Wie Taillenumfang, Blutfette, Blutdruck, Schlaf und Stimmung durch ein Modell laufen, um auf ein höheres oder niedrigeres Herz-Kreislauf-Risiko hinzuweisen.

Vom Forschungsmodell zum Alltagswerkzeug

Da alle 11 Prädiktoren in der Primärversorgung routinemäßig verfügbar sind, übersetzte das Team das leistungsfähigste Modell in einen einfachen webbasierten Rechner. Nutzende geben Alter, Region, ausgewählte medizinische Vorerkrankungen, Taillenumfang, zwei gängige Blutfettwerte, Depressionsscore und die übliche Schlafdauer ein. Das Tool gibt dann eine Schätzung der Wahrscheinlichkeit zurück, innerhalb der nächsten neun Jahre eine kardiovaskuläre Erkrankung zu entwickeln. Die Autoren betonen, dass dieser Rechner dazu gedacht ist, die fachliche Beurteilung zu unterstützen, sie aber nicht zu ersetzen; er sollte neben einer umfassenden klinischen Bewertung, lokalen Ressourcen und den Präferenzen der Patientinnen und Patienten verwendet werden.

Was das für Patientinnen, Patienten und Ärztinnen und Ärzte bedeutet

Die Studie zeigt, dass sorgfältig konzipiertes und erklärbares maschinelles Lernen genauere Langzeitabschätzungen für Herz- und Schlaganfallrisiken bei chinesischen Mittelalten und Älteren liefern kann als traditionelle Formeln. Sie unterstreicht außerdem, dass Faktoren wie Taillenumfang, Blutfette sowie täglicher Schlaf und Stimmung eine Rolle für die zukünftige kardiovaskuläre Gesundheit spielen. Indem diese Erkenntnisse in einen kostenlosen Online-Rechner gepackt werden, bietet die Arbeit Gemeindekliniken und Einzelpersonen eine kostengünstige Möglichkeit, Hochrisikopersonen früher zu identifizieren und maßgeschneiderte Präventionsstrategien zu lenken, während die endgültige Entscheidungsbefugnis bei den Klinikerinnen und Klinikern verbleibt.

Zitation: Zhu, XY., Li, W., Pan, XY. et al. Explainable machine learning for long-term cardiovascular disease risk prediction in Chinese middle-aged and older adults: a 9-year longitudinal cohort study with web-based risk calculator. Sci Rep 16, 14998 (2026). https://doi.org/10.1038/s41598-026-45297-4

Schlüsselwörter: kardiovaskuläre Erkrankung, maschinelles Lernen, Risikovorhersage, Taillenumfang, chinesische Erwachsene