Clear Sky Science · pl

Wielostrumieniowe ramy głębokiego uczenia integrujące obrazy i reprezentacje cech do przewidywania łagodnego zaburzenia poznawczego przy użyciu testu Reya z złożoną figurą

2026-03-01 · Powrót do spisu

Dlaczego rysowanie może ujawniać ukryte problemy z pamięcią

W miarę jak ludzie żyją dłużej, wielu martwi się subtelnymi ubytkami pamięci i tym, czy mogą one sygnalizować wczesne stadia demencji. Lekarze od dawna stosują proste testy rysunkowe na papierze, by ocenić myślenie i pamięć — są szybkie, tanie i łatwe do przeprowadzenia w każdej przychodni. To badanie pokazuje, jak nowoczesna sztuczna inteligencja potrafi wydobyć znacznie więcej informacji z jednego klasycznego testu rysunkowego, przekształcając go w potężne narzędzie wczesnego ostrzegania o łagodnym zaburzeniu poznawczym, które często poprzedza demencję.

Klasyczny rysunek widziany cyfrowymi oczami

Jednym z powszechnie używanych zadań rysunkowych jest Test Złożonej Figury Reya. Osoba proszona jest najpierw o odrysowanie szczegółowego, abstrakcyjnego rysunku, a później o odtworzenie go z pamięci. Tradycyjnie eksperci punktują każdy rysunek w skali do 36 punktów, oceniając, jak dokładnie poszczególne elementy są umieszczone i ukształtowane. Te wyniki dają przydatny obraz zdolności wzrokowo-przestrzennych i pamięci wzrokowej, ale nieuchronnie pomijają wiele subtelnych cech rysunku. Autorzy artykułu postanowili zbudować zautomatyzowany system, który przeanalizuje cały obraz, połączy go z tradycyjną punktacją oraz podstawowymi danymi demograficznymi, takimi jak wiek, płeć i lata edukacji, i zdecyduje, czy ktoś prawdopodobnie ma łagodne zaburzenie poznawcze.

Dwie ścieżki czytania rysunku

Naukowcy zaprojektowali model głębokiego uczenia „dwustrumieniowy”, który przetwarza rysunki danej osoby na dwa różne sposoby jednocześnie. W pierwszej ścieżce, zwanej strumieniem przestrzennym, surowe zeskanowane obrazy trzech rysunków (kopii, natychmiastowego przypomnienia i przypomnienia z opóźnieniem) trafiają do sieci rozpoznawania obrazów. Sieć ta, oparta na architekturze znanej jako EfficientNet, automatycznie uczy się cech wizualnych takich jak kształty, grubość linii i styl rysunku. Specjalny moduł uwagi pomaga systemowi skupić się na najbardziej informatywnych obszarach rysunku. W drugiej ścieżce, zwanej strumieniem punktacji, model przyjmuje tradycyjne wyniki testu Reya — generowane automatycznie przez wcześniej wytrenowaną sieć punktującą — wraz z wiekiem, płcią i wykształceniem osoby. Te ustrukturyzowane liczby są łączone przez prostszą sieć predykcyjną. Wreszcie wyjścia obu strumieni są uśredniane, aby wygenerować pojedyncze prawdopodobieństwo, że osoba ma łagodne zaburzenie poznawcze zamiast prawidłowej funkcji poznawczej.

Nauka od wielu osób starszych

Aby wytrenować i przetestować swój system, zespół użył rysunków od 1740 osób starszych z dużej koreańskiej kohorty badawczej, około połowa z prawidłową funkcją poznawczą, a połowa z łagodnym zaburzeniem poznawczym. Wielokrotnie dzielili ten zestaw danych na zbiory treningowe, walidacyjne i testowe, aby dopracować model i chronić przed przeuczeniem. Co ważne, ocenili też wydajność na niezależnej grupie 222 pacjentów z innego szpitala. Zanim zbudowali modele predykcyjne na tym zewnętrznym zbiorze, użyli swojego zautomatyzowanego narzędzia punktującego, aby sprawdzić duże rozbieżności między ocenami maszynowymi a ludzkimi; w przypadkach znacznych niezgodności eksperci ponownie sprawdzali i korygowali oceny. Ten krok kontroli jakości poprawił zgodność między ocenami ludzkimi a AI, wzmacniając powiązanie między ocenami ręcznymi a automatycznymi.

Jak dobrze system wykrywa wczesne upośledzenie

Naukowcy porównali swój model dwustrumieniowy z kilkoma alternatywami: prostymi modelami statystycznymi wykorzystującymi powszechny krótki test ogólnej funkcji poznawczej, modelami korzystającymi wyłącznie z ocen Reya wystawionych przez ludzi, modelami używającymi tylko ocen Reya generowanych przez AI oraz modelem głębokiego uczenia analizującym jedynie obrazy bez strumienia punktacji. W wielu powtórzeniach w głównej kohorcie i w zewnętrznej grupie szpitalnej system łączony dwustrumieniowy konsekwentnie wypadał najlepiej. W teście zewnętrznym osiągnął pole pod krzywą ROC 0,872 oraz ogólną dokładność około 78 procent, przewyższając zarówno tradycyjne modele oparte na punktacji, jak i sieć głębokiego uczenia działającą tylko na obrazach. Te korzyści sugerują, że połączenie bogatych szczegółów wizualnych i ustrukturyzowanej informacji punktowej daje bardziej stabilny i wiarygodny obraz wczesnych zmian poznawczych.

Co to może oznaczać dla codziennych przychodni

Z punktu widzenia pacjenta nic w samym teście nie musi się zmieniać: nadal siada z ołówkiem i papierem i odrysowuje złożoną figurę. Za kulisami jednak skaner i system AI mogą teraz ocenić rysunki w kilka sekund, wygenerować ustandaryzowane wyniki i dokładniej oszacować ryzyko łagodnego zaburzenia poznawczego niż wiele istniejących szybkich narzędzi przesiewowych. Ponieważ wymaga tylko jednego znajomego testu oraz rutynowych informacji tła, metoda może zostać włączona do pracowitych punktów kontrolnych bez większych zakłóceń. Choć badanie koncentrowało się na uczestnikach koreańskich i używało tylko obrazów statycznych, podejście wskazuje na przyszłość, w której proste rysunki, interpretowane przez inteligentne oprogramowanie, pomagają wczesne wykrywać subtelne problemy poznawcze na tyle wcześnie, by umożliwić znaczącą interwencję.

Cytowanie: Park, J., Seo, E.H., Kim, S. et al. Multi-stream deep learning framework integrating images and feature representations to predict mild cognitive impairment using the rey complex figure test. Sci Rep 16, 9629 (2026). https://doi.org/10.1038/s41598-025-34491-5

Słowa kluczowe: łagodne zaburzenie poznawcze, test Reya z złożoną figurą, przesiewowe głębokie uczenie, ocena poznawcza, zapobieganie demencji