Clear Sky Science · pl
Wzmacnianie odkryć genetycznych i oceny ryzyka sercowo-naczyniowego przez przewidywanie elektrokardiogramów na podstawie genotypu
Odczytywanie serca z naszych genów
Większość osób nigdy nie przejdzie badania rytmu serca we wczesnym okresie życia, podczas gdy niemal każdy ma dziś swoje DNA zmagazynowane w dużych projektach badawczych. To badanie stawia śmiałe pytanie: czy można wykorzystać te zapisy genetyczne do przewidzenia, jak wyglądałby zapis serca danej osoby — a na tej podstawie oszacować jej przyszłe ryzyko chorób serca? Jeśli tak, lekarze mogliby kiedyś ostrzegać ludzi o kłopotach sercowo-naczyniowych na wiele lat przed wystąpieniem objawów, posługując się jedynie próbką krwi lub śliny.

Dlaczego sygnały serca mają znaczenie
Choroby sercowo-naczyniowe są główną przyczyną zgonów na świecie. Proste, bezbolesne badanie zwane elektrokardiogramem (EKG) rejestruje aktywność elektryczną serca i może ujawnić groźne zaburzenia rytmu lub uszkodzenie mięśnia sercowego. Wiele subtelnych cech EKG, takich jak wysokości i szerokości fal, jest częściowo uwarunkowanych genetycznie. Duże badania sugerują, że 40–70% różnic między EKG poszczególnych osób można przypisać genetyce. Niestety w dużych biobankach, jak UK Biobank, tylko około jedna na dziesięć osób ma jednocześnie dane DNA i zapis EKG. Utrudnia to odkrywanie wszystkich genetycznych czynników leżących u podstaw chorób serca i wykorzystanie informacji z EKG do wczesnego prognozowania ryzyka na szeroką skalę.
Nauczanie sieci neuronowej „wyobrażania” EKG
Naukowcy opracowali model głębokiego uczenia o nazwie CapECG, który uczy się przekładać warianty genetyczne danej osoby na 169 szczegółowych pomiarów EKG. Trenowano go na ponad 37 000 osobach pochodzenia europejskiego, które miały zarówno dane DNA, jak i 12-odprowadzeniowe EKG w UK Biobank. Ponieważ genom zawiera miliony silnie powiązanych markerów, najpierw pogrupowano pobliskie warianty w bloki, które mają tendencję do dziedziczenia razem, i zastosowano metodę LD-PCA do skompresowania każdego bloku do kilku kluczowych składowych. CapECG następnie wykorzystuje mechanizm „uwagi” (attention), by ocenić, które bloki są najważniejsze, oraz sieć w stylu kapsułkowym, by wychwycić złożone, warstwowe wzorce między zmianami genetycznymi a cechami EKG.
Jak dobrze model odczytuje genetyczny odcisk serca
W wewnętrznym zestawie testowym obejmującym 7422 osoby przewidywane przez CapECG cechy EKG odpowiadały rzeczywistym pomiarom ze średnią korelacją około 0,62 dla 102 cech, które są wyraźnie dziedziczne. Niektóre cechy były przewidywane szczególnie dobrze, z korelacjami powyżej 0,8. Jednym z ukierunkowań badania był przestrzenny kąt QRS-T, trójwymiarowa miara, jak ze sobą układają się aktywacja elektryczna serca i jego powrót do stanu spoczynkowego w przestrzeni. Ten kąt wiązany jest z groźnymi zaburzeniami rytmu i nagłą śmiercią sercową. CapECG przewidywał ten kąt z korelacją około 0,65, a testy statystyczne wykazały bliską zgodność wartości przewidywanych i obserwowanych, szczególnie dla cech o silniejszym wpływie genetycznym.

Odkrywanie ukrytych wskazówek genetycznych i prognozowanie chorób
Po przeszkoleniu CapECG zastosowano do niemal 390 000 uczestników UK Biobank, którzy mieli dane DNA, ale nie mieli zapisów EKG, skutecznie „uzupełniając” ich EKG wyłącznie na podstawie genów. Zespół przeprowadził następnie szeroko zakrojone badania asocjacyjne genów z tymi przewidywanymi cechami EKG. Dla przestrzennego kąta QRS-T odkryto 133 istotne miejsca genetyczne, w tym 33 pokrywające się z dużym wcześniejszym badaniem obejmującym ponad 118 000 osób — znacznie więcej pokryć niż przy wykorzystaniu mniejszego zestawu rzeczywistych EKG. Podobne korzyści zaobserwowano dla odstępu QT, kluczowego miernika powiązanego z groźnymi arytmiami. Analiza na poziomie genów uwypukliła dziesiątki genów zaangażowanych w przewodzenie elektryczne serca i kontrolę rytmu oraz wskazała dodatkowe kandydatury wcześniej niepowiązane z funkcją serca.
Od przewidywanych zapisów do przyszłych problemów sercowych
Następnie badacze zbudowali kolejny model głębokiego uczenia, DeepCVD, który używa 169 cech EKG przewidywanych przez CapECG oraz wieku i płci do oszacowania ryzyka sześciu głównych schorzeń sercowo-naczyniowych, w tym nadciśnienia tętniczego, zawału serca i migotania przedsionków. Trenowany na setkach tysięcy genetycznie profilowanych uczestników, DeepCVD osiągnął średnią dokładność (AUC) około 0,80 w wydzielonej grupie testowej — znacznie lepiej niż standardowe podejście oparte na poligenicznym wskaźniku ryzyka, które korzystało jedynie z DNA i podstawowych czynników i osiągało około 0,71. Model towarzyszący, DeepCVD-Age, użył tych samych wejść do prognozowania wieku, w którym ktoś może otrzymać diagnozę tych schorzeń; jego przewidywania silnie korelowały (około 0,74) z rzeczywistymi wiekami zapisanymi w bazie danych i dobrze sprawdzały się także u osób spoza pochodzenia europejskiego.
Co to może znaczyć dla pacjentów
Mówiąc prosto, praca ta pokazuje, że system uczenia maszynowego może nauczyć się wystarczająco dużo z połączonych danych DNA i EKG, by „wyobrazić” sobie EKG dla osób, które nigdy nie miały tego badania. Te wyobrażone cechy EKG są na tyle dobre, że nie tylko pozwalają odkrywać nowe geny zaangażowane w rytm i strukturę serca, ale także przewyższają powszechnie stosowane genetyczne wskaźniki ryzyka w przewidywaniu, kto rozwinie chorobę serca i mniej więcej kiedy. Choć podejście wymaga dalszych testów w niezależnych populacjach i dopracowania, wskazuje na przyszłość, w której prosty test genetyczny może dać okno na zdrowie serca danej osoby przez całe życie, na długo przed pojawieniem się pierwszego nieprawidłowego zapisu w gabinecie.
Cytowanie: Lin, S., Yang, Y. & Zhao, H. Empowering genetic discoveries and cardiovascular risk assessment by predicting electrocardiograms from genotype. npj Digit. Med. 9, 255 (2026). https://doi.org/10.1038/s41746-026-02438-3
Słowa kluczowe: prognozowanie ryzyka sercowo-naczyniowego, genetyka elektrokardiogramu, głębokie uczenie w medycynie, badania asocjacyjne obejmujące cały genom, dane biobankowe