Clear Sky Science · pl

Mieszanka ekspertów oparta na Extra Trees do rozpoznawania gestów dłoni z sEMG

2026-03-02 · Powrót do spisu

Odczytywanie mięśni, by poruszać sztucznymi dłońmi

Wyobraź sobie możliwość sterowania robotyczną dłonią tylko przez napięcie mięśni przedramienia, tak naturalnie, jak poruszasz własnymi palcami. W tym badaniu analizuje się, jak zamienić słabe sygnały elektryczne z mięśni na niezawodne polecenia dla protez dłoni i innych urządzeń, używając inteligentniejszego modelu komputerowego, który może rozpoznawać wiele różnych gestów dłoni w czasie rzeczywistym.

Sygnały ukryte pod skórą

Gdy poruszamy rękami, mięśnie generują bardzo słabe sygnały elektryczne, które można wykryć na powierzchni skóry. Badacze stosują elektromiografię powierzchniową, czyli sEMG, w której przylepne elektrody umieszczone na przedramieniu odbierają te sygnały bez igieł czy zabiegów chirurgicznych. Dla każdego gestu — na przykład otwarcia dłoni lub zgięcia poszczególnych palców — wzorzec aktywności elektrycznej jest nieco inny. Problem w tym, że sygnały są bardzo małe i łatwo zanieczyszczane przez szumy spowodowane ruchem, pobliską elektroniką czy innymi mięśniami, więc trzeba je starannie oczyszczać i zamieniać na liczby zrozumiałe dla komputera.

Oczyszczanie i dzielenie sygnałów mięśniowych

Aby zrozumieć surowe nagrania sEMG, zespół najpierw filtruje niechciane brumy z sieci zasilającej oraz inne niskiej i wysokiej częstotliwości zakłócenia, pozostawiając w przeważającej mierze prawdziwą aktywność mięśniową. Zamiast traktować długie nagranie jako jedną całość, sygnały dzielą na krótkie, nakładające się okna czasowe o długości około ćwierć sekundy. Z każdego okna obliczają 17 prostych cech liczbowych opisujących, jak silny, zmienny i energetyczny jest sygnał, zarówno w dziedzinie czasu, jak i częstotliwości. Powstają w ten sposób tysiące kompaktowych migawkowych opisów zachowania mięśni dla każdego gestu, stanowiących surowy materiał, na którym można trenować algorytmy rozpoznawania.

Wiele małych specjalistów zamiast jednego wielkiego sędziego

Wcześniejsze systemy najczęściej trenowały jeden model uczenia maszynowego na wszystkie rodzaje gestów jednocześnie, co może prowadzić do błędnych decyzji, gdy niektóre gesty wyglądają bardzo podobnie. W tej pracy autorzy proponują inną strategię nazwaną MEET (Mixture of Experts Extra Trees). Zamiast jednego uniwersalnego sędziego, MEET wykorzystuje kilka „ekspertów”, z których każdy jest trenowany tylko na niewielkim podzbiorze gestów, oraz jeden model „bramkowy”, który widział wszystkie gesty. Wszystkie te modele opierają się na Extra Trees — technice zespołu drzew decyzyjnych, która buduje wiele prostych drzew z dodatkowym elementem losowości, by uniknąć przeuczenia. Podczas działania eksperci każdy wydają własną prognozę, a bramka decyduje, na ile ufać każdemu ekspertowi dla danego sygnału. Ostateczny wybór to ważona mieszanka tych opinii, co redukuje uprzedzenia i wyostrza granice między podobnymi gestami.

Testy na rzeczywistych osobach i publicznych danych

Badacze zarejestrowali dane sEMG od czterech zdrowych ochotników, z których każdy wykonywał sześć różnych czynności ręki przez dziesiątki sekund każdorazowo. Trenowali MEET i dziesięć standardowych metod uczenia maszynowego na większości danych i testowali je na reszcie. MEET konsekwentnie rozpoznawał prawidłowy gest częściej niż konkurencyjne modele, osiągając dokładności w przybliżeniu od około 78% do 89% wśród czterech osób, przewyższając także swój konstrukcyjny element, klasyczny model Extra Trees. Aby sprawdzić, czy podejście nie jest dopasowane wyłącznie do nagrań z ich laboratorium, ocenili też MEET na znanej publicznej bazie sEMG obejmującej 15 gestów dłoni i ośmiu uczestników. Nawet tam MEET osiągnął najlepsze wyniki, poprawiając średnią dokładność o około 1,25% względem drugiej najlepszej metody, przy czym pozostał na tyle lekki obliczeniowo, że nadaje się do zastosowań w małych urządzeniach wbudowanych.

Dlaczego to ma znaczenie w codziennym życiu

Mówiąc prosto, badanie pokazuje, że „zespół specjalistów” potrafi odczytywać sygnały mięśniowe bardziej niezawodnie niż pojedynczy model uniwersalny. Poprzez połączenie wielu wyspecjalizowanych klasyfikatorów z bramką balansującą ich wpływ, MEET zmniejsza typowe problemy, takie jak przeuczenie i uprzedzenia, jednocześnie zachowując wydajność wystarczającą do sterowania w czasie rzeczywistym. Dla osób używających protez dłoni, interfejsów do gier czy sterowników noszonych na ciele, może to przekładać się na płynniejsze, dokładniejsze reakcje, które bardziej przypominają ruch naturalnej dłoni. Choć obecne badanie obejmuje niewielką liczbę ochotników i ograniczony zestaw gestów, stanowi ono podstawę pod bardziej elastyczne i godne zaufania systemy sterowania oparte na sygnałach mięśniowych, które w przyszłości mogą obsługiwać szersze spektrum użytkowników i ruchów.

Cytowanie: Gehlot, N., Jena, A., Kumar, R. et al. Mixture of experts extra tree-based sEMG hand gesture recognition. Sci Rep 16, 11787 (2026). https://doi.org/10.1038/s41598-026-40305-z

Słowa kluczowe: rozpoznawanie gestów dłoni, elektromiografia powierzchniowa, sterowanie protezami, uczenie maszynowe, mieszanka ekspertów