Clear Sky Science · nl

Computationeel kader om mens–machine-interacties in gesloten-lus, co-adaptieve neurale interfaces te voorspellen en te sturen

· Terug naar het overzicht

Machines leren met ons aanleren

Naarmate hersen‑computerinterfaces en geavanceerde prothetische ledematen vanuit het lab het dagelijks leven binnendringen, rijst een centrale vraag: hoe ontwerpen we apparaten die van ons leren terwijl wij tegelijkertijd leren ze te gebruiken? Deze studie pakt die uitdaging aan door een wiskundig en experimenteel kader te bouwen voor "co-adaptieve" neurale interfaces — systemen waarin zowel de menselijke gebruiker als het decodeeralgoritme continu naar elkaar toe aanpassen, zodat de besturing vloeiender, natuurlijker en betrouwbaarder aanvoelt in de loop van de tijd.

Figure 1
Figure 1.

Een nieuw soort mens–machinepartnerschap

Veel neurale interfaces werken door hoog-dimensionale biologische signalen, zoals spier- of hersenactiviteit, om te zetten in eenvoudige commando’s die een cursor of robotisch ledemaat kunnen bewegen. Traditioneel proberen ontwerpers ofwel de menselijke kant te optimaliseren (de gebruiker trainen om zich aan te passen aan een vaste decoder) ofwel de machinale kant (de decoder laten bijwerken terwijl men een grotendeels vaste gebruiker veronderstelt). In de praktijk leren beide kanten voortdurend. Deze opzet met twee lerenden kan betere prestaties en personalisatie vrijmaken, maar is ook moeilijker te ontwerpen: als het algoritme te snel of op de verkeerde manier aanpast, kan het de gebruiker verwarren in plaats van helpen. De auteurs brengen instrumenten uit de regeltheorie en speltheorie samen om deze verweven leerprocessen te beschrijven, te voorspellen en uiteindelijk te sturen.

Een veilige testomgeving opbouwen voor co-adaptieve interfaces

Om deze dynamieken gecontroleerd te bestuderen, creëerden de onderzoekers een niet-invasieve myo-elektrische interface. Veertien vrijwilligers droegen een 64-elektrodenrooster op hun dominante onderarm. Hun spieractiviteit dreef een computercursor die een zwervend doel op het scherm moest volgen. Onder de motorkap zette een decoder de spiersignalen om in cursorsnelheid en werkte zichzelf elke 20 seconden bij op basis van recente prestaties. Over 16 proefjes van vijf minuten per persoon varieerde het team systematisch hoe snel de decoder leerde, hoe sterk hij werd bestraft voor het gebruiken van grote signaalversterking (zijn "inspanning") en hoe hij werd geïnitialiseerd. Door zowel gedrag als spierpatronen te onderzoeken, bevestigden ze dat gebruikers niet simpelweg wachtten tot het algoritme verbeterde; ze veranderden actief hoe ze hun spieren gebruikten binnen en tussen proeven, waarmee ze een echte co-adaptieve mens–machine-lus creëerden.

Regeltheorie gebruiken om in de lus te kijken

De volgende stap was deze rommelige interactie om te zetten in een model dat gemeten en getest kon worden. Met concepten uit de regeltheorie schatten de auteurs een compacte wiskundige beschrijving van ieders strategie — een "encoder" die doel- en cursorinformatie omzet in patronen van spieractiviteit. Deze encoder kon worden opgesplitst in een voorspellend, feedforward-gedeelte en een corrigerend, feedback-gedeelte. Door de geschatte encoder te combineren met de bekende decoder kon het team beoordelen of het hele systeem op koers lag voor nauwkeurige en stabiele besturing. Ze vonden dat het gecombineerde gebruiker–decoderpaar in de loop van de tijd geneigd was te bewegen naar waarden die voorspeld werden als goed voor volgen en stabiliteit, ook al stopten noch de gebruiker noch de decoder ooit volledig met veranderen. Gebruikers toonden ook tekenen van langduriger leren, waarbij hun spierkoppelingen minder van proef tot proef verschoven naarmate ze bekwamer werden.

Figure 2
Figure 2.

Speltheorie onthult hoe leeregelingen gedrag vormen

Om verder te gaan dan beschrijving en daadwerkelijk te voorspellen hoe ontwerpkeuzes co-adaptatie zouden beïnvloeden, wenden de auteurs zich tot speltheorie, die bestudeert hoe meerdere besluitnemers interageren wanneer ieder zijn eigen kosten probeert te minimaliseren. Ze modelleerden de gebruiker en decoder als twee "spelers" die beiden belang hechten aan het verminderen van volgfout, maar ook een prijs betalen voor inspanning — spieractivatie voor de gebruiker en grote versterkingen voor de decoder. In dit kader kan het gezamenlijke systeem in een van meerdere stabiele toestanden, of stationaire punten, terechtkomen, afhankelijk van leersnelheden, inspanningsstraffen en begincondities. Het model deed concrete voorspellingen: de leersnelheid van de decoder zal sterk bepalen hoe snel en hoe goed het systeem convergeert; het aanpassen van de inspanningsstraf van de decoder zou verschuiven hoeveel inspanning de gebruiker moet leveren zonder noodzakelijkerwijs de nauwkeurigheid te veranderen; en initiële decoderinstellingen konden subtiel de uiteindelijke strategie van de gebruiker beïnvloeden.

Testen hoe algoritmen menselijk leren sturen

De experimenten bevestigden deze voorspellingen grotendeels. Wanneer de decoder langzaam leerde, verbeterden gebruikers meer binnen een proef en bewoog het gecombineerde encoder–decoderpaar dichter naar het theoretisch ideale regime voor nauwkeurige en stabiele cursorbesturing. Wanneer de decoder te snel adap-teerde, leed de prestatie en veranderden gebruikers hun spierstrategieën minder, wat suggereert dat de machine sneller bewoog dan mensen konden bijhouden. Het veranderen van de inspanningsstraf van de decoder bood een ander stuurelement: hogere straffen dwongen de decoder minder hard te werken, wat op zijn beurt veel gebruikers ertoe bracht hun eigen spierinspanning te verhogen om de nauwkeurigheid te behouden. Interessant genoeg verschilden deelnemers in hoe ze inspanning en cursorsnelheid afwogen — sommigen kozen ervoor harder te werken om de cursor snel te houden, anderen accepteerden tragere bewegingen om inspanning te besparen — wat duidt op individuele voorkeuren die toekomstige interfaces zouden kunnen personaliseren.

Wat dit betekent voor toekomstige neurale interfaces

Simpel gezegd laat dit werk zien dat de trainingsregels ingebouwd in neurale interface-algoritmen meer doen dan ruisige signalen opschonen; ze vormen actief hoe mensen leren het apparaat te gebruiken. Door rigoureuze modellering te combineren met humane experimenten bieden de auteurs een gereedschapsset voor het principieel kiezen van decoder-leersnelheden, inspanningsstraffen en initialisaties, in plaats van op trial-and-error te vertrouwen. Hun kader kan het ontwerp sturen van next‑generation protheses, revalidatiehulpmiddelen en hersen‑computerinterfaces die niet alleen nauwkeurig zijn, maar ook stabiel, comfortabel en afgestemd op ieders leerstijl.

Bronvermelding: Madduri, M.M., Yamagami, M., Li, S.J. et al. Computational framework to predict and shape human–machine interactions in closed-loop, co-adaptive neural interfaces. Nat Mach Intell 8, 372–387 (2026). https://doi.org/10.1038/s42256-026-01194-z

Trefwoorden: neurale interfaces, mens-machine-interactie, co-adaptieve sturing, myo-elektrische cursorbesturing, ontwerp van hersen-computerinterfaces