Clear Sky Science · pl

Dwugalążkowe głębokie uczenie do rozpoznawania emocji z sygnałów EEG

· Powrót do spisu

Dlaczego czytanie fal mózgowych może pomóc w dbaniu o nastrój

Zaburzenia zdrowia psychicznego, takie jak stres, lęk czy depresja, często rozwijają się zanim my lub osoby w naszym otoczeniu w pełni je zauważymy. A gdyby codzienne urządzenia mogły dyskretnie śledzić nasz stan emocjonalny i sygnalizować, kiedy warto zrobić przerwę lub poszukać wsparcia? W artykule opisano nowy sposób odczytywania wzorców aktywności mózgu za pomocą zestawu rejestrującego sygnały elektryczne ze skóry głowy oraz połączenie tych danych z nowoczesną sztuczną inteligencją, by rozpoznawać emocje szybko, dokładnie i przy minimalnym ręcznym dostrajaniu.

Figure 1
Figure 1.

Przekształcanie sygnałów mózgowych w wskazówki emocjonalne

Nasz mózg nieustannie generuje słabe impulsy elektryczne, które można mierzyć techniką zwaną EEG, czyli elektroencefalografią. Te sygnały zmieniają się subtelnie, gdy czujemy spokój, stres czy rozbawienie. Tradycyjne metody interpretacji danych EEG opierają się w dużej mierze na eksperckim ręcznym konstruowaniu cech matematycznych z surowych sygnałów — to proces powolny i często kruchy, słabo przenoszący się między badaniami. Autorzy dążą do zastąpienia tej pracy systemem end‑to‑end, który uczy się bezpośrednio z danych, dzięki czemu rozpoznawanie emocji może stać się bardziej niezawodne i łatwiejsze do wdrożenia w monitorowaniu zdrowia psychicznego poza laboratorium.

Dwie ścieżki rozumienia tego samego sygnału

Rdzeniem badania jest model głębokiego uczenia z dwiema gałęziami, które analizują ten sam sygnał EEG w sposób komplementarny. Jedna gałąź skupia się na tym, jak sygnał zmienia się w czasie — surowe sekwencje fal mózgowych trafiają do typu sieci neuronowej zwanej LSTM, która dobrze radzi sobie z uchwyceniem wzorców i rytmów. Druga gałąź przekształca ten sam sygnał w mapę częstotliwości, podobnie jak inżynierowie dźwięku wizualizują audio, i przekazuje ją przez sieć splotową, efektywną w wykrywaniu lokalnych wzorców. Pozwalając jednej gałęzi specjalizować się w czasie, a drugiej w częstotliwości, system wychwytuje bogatsze informacje o tym, jak różne emocje manifestują się w mózgu.

Pozwalanie dwóm perspektywom uczyć się od siebie nawzajem

Zamiast traktować te dwie gałęzie jako oddzielnych ekspertów spotykających się tylko na końcu, autorzy projektują je tak, żeby wchodziły w interakcje obustronne. Cechy oparte na spektrze są przekształcane z powrotem w formę przypominającą sygnał i przepuszczane przez dodatkową sieć temporalną, co zachęca model do sprawdzenia, czy wzorce widoczne w spektrum mają sens także w czasie. Podobnie podsumowanie wygenerowane przez gałąź temporalną jest zamieniane w syntetyczny sygnał, konwertowane na mapę częstotliwości i ponownie analizowane przez gałąź spektralną. Ta wymiana w obie strony pomaga modelowi dojść do wspólnego wniosku, które cechy sygnału naprawdę mają znaczenie przy rozróżnianiu stanów emocjonalnych. Na koniec model łączy te perspektywy za pomocą prostych operacji matematycznych, które uwypuklają obszary silnej zgodności obu gałęzi, po czym wynik trafia do kompaktowego klasyfikatora zwracającego kategorię emocji.

Figure 2
Figure 2.

Testy w różnych warunkach rzeczywistych

Aby sprawdzić, czy ich metoda działa poza jednym starannie kontrolowanym eksperymentem, autorzy testują ją na trzech publicznych zbiorach danych obejmujących emocje i stres w bardzo różnych sytuacjach. Jeden wykorzystuje konsumencką opaskę do rejestracji pozytywnych, neutralnych i negatywnych uczuć podczas oglądania klipów filmowych. Drugi śledzi ochotników wyposażonych w czujniki na klatce piersiowej i nadgarstku podczas stresujących rozmów kwalifikacyjnych, spokojnych faz bazowych i zabawnych nagrań. Trzeci obserwuje pracowników biurowych mierzących się z presją czasu i przerwami w dłuższych sesjach. W tych zróżnicowanych scenariuszach, przy użyciu różnych urządzeń i uczestników, model dwugalążkowy osiąga imponująco wysoką dokładność — powyżej 96 procent na zbiorze fal mózgowych i praktycznie idealne wyniki na pozostałych dwóch — zachowując przy tym konstrukcję wystarczająco wydajną do pracy w niemal czasie rzeczywistym.

Co to oznacza dla codziennego życia

Mówiąc prosto, badanie pokazuje, że połączenie dwóch prostych, lecz komplementarnych spojrzeń na aktywność mózgu i pozwolenie im na ciągłe wzajemne dopasowywanie może dać system rozpoznawania emocji jednocześnie silny i praktyczny. Zamiast polegać na kruchych, ręcznie konstruowanych cechach, ramy uczą się bezpośrednio z danych i pozostają odporne na nowe osoby i warunki rejestracji. Choć potrzeba dalszych prac nad adaptacją między zbiorami, zmniejszeniem wymaganych zasobów dla urządzeń noszonych i włączeniem dodatkowych sygnałów ciała, podejście dwugalążkowe wskazuje drogę do przyszłych narzędzi, które mogłyby dyskretnie monitorować nasze emocjonalne samopoczucie, oferując wczesne ostrzeżenia i spersonalizowane wsparcie na długo zanim nastąpi kryzys.

Cytowanie: Saha, D., Ali, A., Gulvanskii, V. et al. A dual-branch deep learning framework for emotion recognition from EEG signals. Sci Rep 16, 13076 (2026). https://doi.org/10.1038/s41598-026-42998-8

Słowa kluczowe: rozpoznawanie emocji z EEG, głębokie uczenie, monitorowanie zdrowia psychicznego, interfejsy mózg–komputer, wykrywanie stresu