Clear Sky Science · pl

Wyjaśnialne uczenie maszynowe do przewidywania długoterminowego ryzyka chorób sercowo-naczyniowych u chińskich osób w średnim i starszym wieku: 9-letnie badanie kohortowe z internetowym kalkulatorem ryzyka

· Powrót do spisu

Dlaczego przewidywanie ryzyka sercowego ma znaczenie

Choroby sercowo-naczyniowe są obecnie główną przyczyną zgonów w Chinach, zwłaszcza wśród osób w średnim i późniejszym okresie życia. Jednak większość narzędzi używanych przez lekarzy do oszacowania przyszłego ryzyka zawału i udaru została opracowana na populacjach zachodnich i nie pasuje dobrze do chińskich dorosłych. W tym badaniu sprawdzono, czy nowoczesne metody sztucznej inteligencji mogą dostarczyć dokładniejszych, a jednocześnie zrozumiałych, długoterminowych oszacowań ryzyka dostosowanych do chińskich osób w wieku 45 lat i starszych.

Krajowe spojrzenie na starzejące się serca

Naukowcy sięgnęli do China Health and Retirement Longitudinal Study, dużego, trwającego badania populacyjnego, które śledzi dziesiątki tysięcy dorosłych mieszkających w społecznościach w większości prowincji. Z tych danych wybrano 8 080 osób w wieku co najmniej 45 lat, które nie miały chorób sercowo-naczyniowych na początku badania w 2011 r. Uczestników śledzono przez dziewięć lat w celu wykrycia nowych przypadków chorób serca i udarów. Zespół rozpoczął analizę od 77 informacji łatwych do zebrania w przychodniach, w tym wieku, regionu, wcześniejszych chorób, objawów nastroju, nawyków snu, pomiarów ciała i wyników badań krwi. Stosując standardowe testy statystyczne, zawężono to do 11 kluczowych czynników, które były zarówno praktyczne do zmierzenia, jak i silnie związane z późniejszymi zdarzeniami sercowo-naczyniowymi.

Figure 1. Wykorzystanie danych od chińskich dorosłych do przewidywania, kto jest bardziej narażony na wystąpienie problemów sercowych lub udaru w ciągu następnej dekady.
Figure 1. Wykorzystanie danych od chińskich dorosłych do przewidywania, kto jest bardziej narażony na wystąpienie problemów sercowych lub udaru w ciągu następnej dekady.

Nauczanie komputerów wykrywania wzorców

Następnie badacze przetestowali dziesięć różnych komputerowych metod predykcyjnych, od tradycyjnej regresji logistycznej po bardziej elastyczne podejścia, takie jak lasy losowe, gradient boosting i sieci neuronowe. Podzielili uczestników na grupę treningową, używaną do budowy każdego modelu, oraz oddzielną grupę walidacyjną, służącą do testowania, jak dobrze modele działają na nowych osobach. Wydajność oceniano na podstawie tego, jak dokładnie każda metoda rozróżniała osoby, które rozwinęły chorobę sercowo-naczyniową, od tych, które pozostały bez niej, jak dobrze przewidywane ryzyko odpowiadało rzeczywistym częstościom zdarzeń oraz jak użyteczne były przewidywania w praktycznych decyzjach dotyczących tego, kto powinien otrzymać dodatkowe środki zapobiegawcze.

Które codzienne czynniki miały największe znaczenie

Metoda lasu losowego okazała się najlepsza, osiągając wysoką dokładność i najlepszą równowagę między wychwytywaniem osób o wysokim ryzyku a unikaniem fałszywych alarmów. Aby udostępnić działanie tej metody, zespół zastosował technikę wyjaśniania zwaną SHAP, która przypisuje każdemu czynnikowi ryzyka wkład w ostateczne przewidywanie. Analiza wykazała, że obwód talii był pojedynczym, najbardziej wpływowym czynnikiem: każdy dodatkowy centymetr w talii znacząco podnosił dziewięcioletnie ryzyko, podkreślając znaczenie tłuszczu brzusznego w tej populacji. Wysoki poziom trójglicerydów, starszy wiek i historia nadciśnienia również były głównymi czynnikami ryzyka, podczas gdy wyższe poziomy ochronnego cholesterolu HDL wiązały się z niższym ryzykiem. Co ciekawe, nastrój i wzorce snu niosły niezależną informację: wyższe wyniki depresji oraz zbyt krótki lub zbyt długi sen nocny oba podnosiły ryzyko nawet po uwzględnieniu tradycyjnych czynników medycznych.

Figure 2. Jak obwód talii, tłuszcze we krwi, ciśnienie krwi, sen i nastrój przepływają przez model, sygnalizując wyższe lub niższe ryzyko chorób serca.
Figure 2. Jak obwód talii, tłuszcze we krwi, ciśnienie krwi, sen i nastrój przepływają przez model, sygnalizując wyższe lub niższe ryzyko chorób serca.

Z modelu badawczego do narzędzia codziennego użytku

Ponieważ wszystkie 11 predyktorów jest rutynowo dostępnych w opiece podstawowej, zespół przekształcił najlepiej działający model w prosty internetowy kalkulator. Użytkownicy wprowadzają wiek, region, wybrane elementy historii medycznej, obwód talii, dwa powszechne pomiary tłuszczów we krwi, wynik depresji i zwykłą długość snu. Narzędzie zwraca wówczas oszacowanie szansy danej osoby na rozwój choroby sercowo-naczyniowej w ciągu następnych dziewięciu lat. Autorzy podkreślają, że kalkulator ma wspierać, a nie zastępować, profesjonalny osąd i powinien być stosowany wraz z pełną oceną kliniczną, lokalnymi zasobami i preferencjami pacjenta.

Co to oznacza dla pacjentów i lekarzy

Badanie pokazuje, że starannie zaprojektowane i wyjaśnialne uczenie maszynowe może dostarczać dokładniejszych długoterminowych szacunków ryzyka zawału i udaru dla chińskich osób w średnim i starszym wieku niż tradycyjne formuły. Podkreśla też, że to, co dzieje się w obszarze talii, w profilu tłuszczów krwi oraz w codziennym śnie i nastroju, ma znaczenie dla przyszłego zdrowia sercowo-naczyniowego. Opakowując te wnioski w darmowy kalkulator online, praca oferuje przychodniom i osobom indywidualnym niedrogą metodę wcześniejszego identyfikowania osób o wyższym ryzyku i ukierunkowania spersonalizowanych strategii zapobiegawczych, pozostawiając ostateczne decyzje w rękach klinicystów.

Cytowanie: Zhu, XY., Li, W., Pan, XY. et al. Explainable machine learning for long-term cardiovascular disease risk prediction in Chinese middle-aged and older adults: a 9-year longitudinal cohort study with web-based risk calculator. Sci Rep 16, 14998 (2026). https://doi.org/10.1038/s41598-026-45297-4

Słowa kluczowe: choroby sercowo-naczyniowe, uczenie maszynowe, prognozowanie ryzyka, obwód talii, chińscy dorośli