Clear Sky Science · pl

Wyjaśnialne ramy sztucznej inteligencji do prognozowania choroby niedokrwiennej serca z wykorzystaniem ulepszonej selekcji cech metodą szukania wiewiórek

2026-04-01 · Powrót do spisu

Dlaczego mądrzejsze badania serca mają znaczenie

Choroby serca wciąż pozostają największą przyczyną zgonów na świecie, jednak lekarze często muszą godzić ograniczony czas, wiele wyników badań i złożone narzędzia komputerowe. To badanie pokazuje, jak łatwy do wyjaśnienia system sztucznej inteligencji może pomóc lekarzom wcześnie wykrywać chorobę niedokrwienną serca, jednocześnie jasno przedstawiając swoje rozumowanie. Zamiast ukrywać decyzje w czarnej skrzynce, system wyróżnia kilka najważniejszych pomiarów, co pozwala klinicystom korzystać ze wsparcia komputerowego bez utraty zaufania czy kontroli.

Figure 1. System AI wykorzystujący kluczowe badania medyczne pomaga lekarzom szybko ocenić ryzyko choroby serca u pacjenta.

Problemy sercowe i dane, które je opisują

Choroba niedokrwienna serca występuje, gdy przepływ krwi do serca jest ograniczony, często z powodu zwężonych tętnic. Lekarze analizują wiele informacji, takich jak wiek, ciśnienie krwi, cholesterol, ból w klatce piersiowej oraz wyniki badań obrazowych serca. Zbiór danych UCI Heart Disease użyty w tej pracy zawiera 303 rekordy pacjentów z 13 takimi czynnikami oraz etykietą wskazującą obecność lub brak choroby. Choć ta rozpiętość danych sprzyja predykcji, zbyt wiele nakładających się lub mało użytecznych pomiarów może mylić ludzi i komputery, spowalniać analizę i czasem obniżać dokładność.

Czyszczenie i odchudzanie kart pacjenta

Zanim komputer może się uczyć na podstawie danych, surowe zapisy muszą zostać oczyszczone i przekształcone. Badacze uzupełnili brakujące wartości metodą wykorzystującą informacje od podobnych pacjentów, przeskalowali wszystkie pomiary do wspólnego zakresu, zamienili kategorie tekstowe, takie jak typ bólu w klatce piersiowej, na formę numeryczną i dokładnie sprawdzili nietypowe wartości, aby odróżnić rzeczywiste przypadki skrajne od prawdopodobnych błędów. Zbalansowali też liczbę pacjentów chorych i zdrowych, generując realistyczne dodatkowe przykłady dla mniejszej grupy, oraz usunęli cechy niemal identyczne ze sobą. Efektem jest uporządkowana tabela, w której każda kolumna ma znaczenie i nadaje się do analizy.

Jak szybujące wiewiórki inspirują wybór cech

Główną ideą badania jest to, że komputer nie potrzebuje wszystkich dostępnych pomiarów, aby dobrze przewidywać. Zamiast tego powinien automatycznie wyszukać niewielki zestaw najbardziej informatywnych cech. Do tego celu autorzy wykorzystują metodę optymalizacji inspirowaną sposobem, w jaki szybujące wiewiórki poszukują pożywienia w lesie. W ich ulepszonej procedurze Enhanced Squirrel Search Optimization każda „wiewiórka” reprezentuje możliwy podzbiór cech, a grupa wspólnie przeszukuje przestrzeń rozwiązań, dostosowując ruchy, gdy postęp utknie. Najlepiej działające kombinacje są zachowywane i udoskonalane, w poszukiwaniu jak najmniejszego zestawu pomiarów, który nadal zapewnia wysoką dokładność decyzji.

Figure 2. Wybrane pomiary testów sercowych przepływają przez model możliwy do wyjaśnienia, aby pogrupować pacjentów na zdrowych i zagrożonych.

Uczenie modelu i otwieranie czarnej skrzynki

Gdy inspirowane wiewiórkami wyszukiwanie wybierze optymalny podzbiór cech, trenuje się model Lasu Losowego do przewidywania, kto ma chorobę serca. Las Losowy wykorzystuje wiele nieco różnych drzew decyzyjnych, których głosy są łączone, co sprawia, że końcowa prognoza jest odporna na szum w danych. Na wybranych cechach model osiąga około 96–98 procent trafności i bardzo wysoką zdolność rozróżniania pacjentów chorych i zdrowych. Aby uczynić jego logikę zrozumiałą, badacze stosują następnie dwa narzędzia wyjaśniające. Jedno, zwane SHAP, ukazuje, które czynniki mają największy wpływ w całym zbiorze danych, podczas gdy drugie, LIME, skupia się na pojedynczych pacjentach, pokazując, jak ich konkretne wartości przesuwają prognozę w stronę wyższego lub niższego ryzyka.

Co to oznacza dla pacjentów i lekarzy

Mówiąc wprost, badanie tworzy pomocnik do przewidywania chorób serca, który jest zarówno precyzyjny, jak i przejrzysty. Poprzez ograniczenie wejścia do kilku kluczowych pomiarów i zastosowanie jasnych wizualnych wyjaśnień, system może powiedzieć klinicyście nie tylko, że pacjent prawdopodobnie ma chorobę niedokrwienną serca, lecz także które wyniki, takie jak konkretny wynik skanu czy zmiana związana z wysiłkiem, napędzają tę ocenę. To połączenie dokładności, prostoty i klarowności sprawia, że podejście jest lepiej przystosowane do rzeczywistych klinik i może być w przyszłości rozszerzone na większe szpitale oraz bogatsze źródła danych, takie jak urządzenia noszone i badania obrazowe.

Cytowanie: Cenitta, D., Arul, N., Arjunan, R.V. et al. An explainable artificial intelligence framework for ischemic heart disease prediction using enhanced squirrel search feature selection. Sci Rep 16, 15422 (2026). https://doi.org/10.1038/s41598-026-46823-0

Słowa kluczowe: choroba niedokrwienna serca, wyjaśnialna AI, prognozowanie chorób serca, selekcja cech, las losowy