Clear Sky Science · fr

Cadre computationnel pour prédire et façonner les interactions homme–machine dans des interfaces neuronales en boucle fermée co-adaptatives

2026-03-23 · Retour à l’index

Apprendre aux machines à apprendre avec nous

À mesure que les interfaces cerveau–ordinateur et les prothèses avancées sortent du laboratoire pour entrer dans la vie quotidienne, une question centrale apparaît : comment concevoir des dispositifs qui apprennent de nous en même temps que nous apprenons à les utiliser ? Cette étude relève ce défi en développant un cadre mathématique et expérimental pour des interfaces neuronales « co‑adaptatives » — des systèmes où l’utilisateur humain et l’algorithme de décodage s’ajustent continuellement l’un à l’autre afin que le contrôle devienne plus fluide, plus naturel et plus fiable avec le temps.

Un nouveau type de partenariat homme–machine

Beaucoup d’interfaces neuronales fonctionnent en traduisant des signaux biologiques à haute dimensionnalité, comme l’activité musculaire ou cérébrale, en commandes simples capables de déplacer un curseur ou un membre robotique. Traditionnellement, les concepteurs cherchent à optimiser soit le côté humain (former l’utilisateur à s’adapter à un décodeur fixe), soit le côté machine (laisser le décodeur évoluer en supposant un utilisateur essentiellement constant). En réalité, les deux apprennent en permanence. Ce dispositif à deux apprenants peut débloquer de meilleures performances et une personnalisation accrue, mais il complique aussi la conception : si l’algorithme s’adapte trop vite ou de façon inappropriée, il risque de déstabiliser l’utilisateur plutôt que de l’aider. Les auteurs réunissent des outils de la théorie du contrôle et de la théorie des jeux pour décrire, prédire et finalement façonner ces processus d’apprentissage imbriqués.

Construire un banc d’essai sûr pour les interfaces co‑adaptatives

Pour étudier ces dynamiques de manière contrôlée, les chercheurs ont créé une interface myoélectrique non invasive. Quatorze volontaires ont porté une grille de 64 électrodes sur leur avant‑bras dominant. Leur activité musculaire pilotait un curseur informatique qui devait suivre une cible errante à l’écran. Sous le capot, un décodeur convertissait les signaux musculaires en vitesse du curseur et se mettait à jour toutes les 20 secondes en fonction des performances récentes. Sur 16 essais de cinq minutes par personne, l’équipe a varié systématiquement la vitesse d’apprentissage du décodeur, la pénalité pour l’utilisation de gains de signal élevés (son « effort ») et son initialisation. En examinant à la fois le comportement et les schémas musculaires, ils ont confirmé que les utilisateurs n’attendaient pas simplement que l’algorithme s’améliore ; ils modifiaient activement la façon dont ils utilisaient leurs muscles au sein des essais et d’un essai à l’autre, créant une véritable boucle co‑adaptative homme–machine.

Utiliser la théorie du contrôle pour voir à l’intérieur de la boucle

L’étape suivante a consisté à transformer cette interaction complexe en un modèle mesurable et testable. En s’appuyant sur des idées de la théorie du contrôle, les auteurs ont estimé une description mathématique compacte de la stratégie de chaque utilisateur — un « encodeur » qui mappe les informations de la cible et du curseur sur des schémas d’activité musculaire. Cet encodeur se séparait en une partie prédictive, feedforward, et une partie corrective, feedback. En combinant l’encodeur estimé avec le décodeur connu, l’équipe pouvait évaluer si l’ensemble du système évoluait vers un contrôle précis et stable. Ils ont constaté qu’avec le temps, la paire utilisateur–décodeur tendait vers des valeurs prédites comme favorables pour le suivi et la stabilité, bien qu’aucun des deux n’ait cessé complètement de changer. Les utilisateurs montraient aussi des signes d’apprentissage à plus long terme : leurs cartographies musculaires évoluaient moins d’un essai à l’autre à mesure qu’ils devenaient plus habiles.

La théorie des jeux révèle comment les règles d’apprentissage façonnent le comportement

Pour aller au‑delà de la description et réellement prédire comment les choix de conception affecteraient la co‑adaptation, les auteurs se sont tournés vers la théorie des jeux, qui étudie l’interaction entre plusieurs décideurs cherchant chacun à minimiser son propre coût. Ils ont modélisé l’utilisateur et le décodeur comme deux « joueurs » qui tiennent tous deux à réduire l’erreur de suivi mais paient aussi un prix pour l’effort — activation musculaire pour l’utilisateur et grands gains pour le décodeur. Dans ce cadre, le système conjoint peut se stabiliser dans l’un de plusieurs états stationnaires, selon les taux d’apprentissage, les pénalités d’effort et les conditions initiales. Le modèle a produit des prédictions concrètes : le taux d’apprentissage du décodeur devrait fortement influencer la rapidité et la qualité de la convergence ; ajuster la pénalité d’effort du décodeur devrait modifier l’effort que l’utilisateur doit fournir sans forcément changer la précision ; et les réglages initiaux du décodeur pourraient biaiser subtilement la stratégie finale de l’utilisateur.

Tester comment les algorithmes orientent l’apprentissage humain

Les expériences ont largement confirmé ces prédictions. Quand le décodeur apprenait lentement, les utilisateurs s’amélioraient davantage au sein d’un essai, et la paire encodeur–décodeur se rapprochait du régime théoriquement idéal pour un contrôle du curseur précis et stable. Quand le décodeur s’adaptait trop vite, les performances se dégradaient et les utilisateurs modifiaient moins leurs stratégies musculaires, suggérant que la machine évoluait plus vite que les humains ne pouvaient suivre. Modifier la pénalité d’effort du décodeur fournissait un autre levier : des pénalités plus élevées poussaient le décodeur à travailler moins, ce qui conduisait beaucoup d’utilisateurs à augmenter leur propre effort musculaire pour maintenir la précision. Fait intéressant, les participants différaient dans la façon d’équilibrer effort et vitesse du curseur — certains préféraient travailler davantage pour garder le curseur rapide, tandis que d’autres acceptaient un mouvement plus lent pour économiser leur effort — suggérant des préférences individuelles que de futures interfaces pourraient personnaliser.

Ce que cela signifie pour les interfaces neuronales futures

Concrètement, ce travail montre que les règles d’apprentissage intégrées aux algorithmes d’interface neuronale font plus que nettoyer des signaux bruyants ; elles façonnent activement la façon dont les personnes apprennent à utiliser le dispositif. En combinant une modélisation rigoureuse avec des expériences humaines, les auteurs fournissent une boîte à outils pour choisir de manière raisonnée les taux d’apprentissage du décodeur, les pénalités d’effort et les initialisations, plutôt que par essai‑erreur. Leur cadre pourrait orienter la conception de prothèses de nouvelle génération, d’outils de rééducation et d’interfaces cerveau–ordinateur qui ne soient pas seulement précises, mais aussi stables, confortables et adaptées au style d’apprentissage de chaque utilisateur.

Citation: Madduri, M.M., Yamagami, M., Li, S.J. et al. Computational framework to predict and shape human–machine interactions in closed-loop, co-adaptive neural interfaces. Nat Mach Intell 8, 372–387 (2026). https://doi.org/10.1038/s42256-026-01194-z

Mots-clés: interfaces neuronales, interaction homme machine, contrôle co-adaptatif, contrôle de curseur myoélectrique, conception d’interface cerveau‑ordinateur