Clear Sky Science · ja

閉ループで共適応する神経インタフェースにおける人間–機械相互作用を予測・設計する計算フレームワーク

· 一覧に戻る

機械に私たちと共に学ばせる

脳–コンピュータインタフェースや高度な義肢が研究室から日常の場面へ移行するにつれ、重要な問いが浮かび上がります。機器が私たちと同時に学習するように、どう設計すればよいか? 本研究はこの課題に取り組み、「共適応」神経インタフェースのための数理的かつ実験的フレームワークを構築します。ここでは、人間のユーザーと復号アルゴリズムが互いに継続的に調整し合い、時間とともに制御がより滑らかで自然かつ信頼性の高いものになることを目指します。

Figure 1
Figure 1.

新しい種類の人間–機械パートナーシップ

多くの神経インタフェースは、筋電や脳活動などの高次元な生体信号をカーソルやロボット肢を動かす単純なコマンドに変換して動作します。従来は、固定された復号器に適応するユーザー側を訓練するか、あるいはユーザーは概ね固定で復号器のみを更新するかのどちらかを最適化することが多かった。しかし現実には、両者が常に学習しています。この二つの学習者による構成は、性能向上や個別最適化を開く一方で設計は難しくなります。アルゴリズムが速すぎたり不適切に適応すると、助けるどころかユーザーを混乱させることがあるからです。著者らは制御理論とゲーム理論の手法を組み合わせ、これらの絡み合う学習過程を記述・予測・最終的に設計する方法を提示します。

共適応インタフェースの安全な試験基盤の構築

これらの動態を制御された形で調べるために、研究者たちは非侵襲の筋電インタフェースを作成しました。14名の参加者が利き前腕に64電極のグリッドを装着し、筋活動が画面上の徘徊するターゲットを追うコンピューラのカーソルを駆動しました。内部では、復号器が筋信号をカーソル速度に変換し、最近のパフォーマンスに基づいて20秒ごとに自身を更新しました。各被験者につき16回の5分間試行を通して、研究チームは復号器の学習速度、信号ゲインの大きさに対する罰則(「努力」)の強さ、初期化方法を体系的に変化させました。行動と筋パターンの両方を調べることで、ユーザーが単にアルゴリズムの改善を待っているのではなく、試行内および試行間で筋の使い方を能動的に変化させ、真の共適応的な人間–機械ループを作り出していることを確認しました。

ループ内部を可視化するための制御理論の応用

次の段階は、この複雑な相互作用を計測・検証可能なモデルに落とし込むことでした。制御理論の発想を用いて、著者らは各ユーザーの戦略を要約するコンパクトな数理記述――ターゲットやカーソル情報を筋活動パターンに写像する「エンコーダ」――を推定しました。このエンコーダは予測的なフィードフォワード成分と訂正的なフィードバック成分に分けられます。推定されたエンコーダと既知の復号器を組み合わせることで、システム全体が正確で安定した制御に向かっているかどうかを評価できました。時間とともに、ユーザーと復号器の組み合わせは、どちらも完全に変化を止めることはないものの、良好な追従性と安定性を与えると予測される値へと向かう傾向がありました。さらに、ユーザーは長期的学習の兆候を示し、熟練が進むにつれて試行間の筋マッピングの変動が減少しました。

Figure 2
Figure 2.

ゲーム理論が学習規則と行動の関係を明らかにする

記述を越えて設計選択が共適応にどう影響するかを予測するため、著者らはゲーム理論に取り組みました。ゲーム理論は、各主体が自分のコストを最小化しようとする際に複数の意思決定者がどのように相互作用するかを扱います。ここではユーザーと復号器を二人の「プレイヤー」としてモデル化し、両者が追従誤差を減らすことを重視する一方で、努力(ユーザーの筋活動や復号器の大きなゲイン)に対する代償も支払うとしました。この枠組みでは、学習率、努力の罰則、初期条件に応じて、結合システムは複数の安定状態(定常点)のいずれかに落ち着く可能性があります。モデルは具体的な予測を示しました。復号器の学習率はシステムがどれだけ速く、どれだけ良く収束するかに強く影響すること。復号器の努力罰則を調整するとユーザーが投じる努力量が変わるが、必ずしも精度を変えないこと。初期の復号器設定がユーザーの最終的な戦略に微妙なバイアスをかけうること、などです。

アルゴリズムが人間の学習をどう誘導するかの実験的検証

実験はこれらの予測を概ね支持しました。復号器がゆっくり学習すると、ユーザーは試行内でより多く改善し、結合したエンコーダ–復号器のペアは正確で安定したカーソル制御の理論的に望ましい領域へ近づきました。逆に復号器が速く適応しすぎると、パフォーマンスが低下し、ユーザーは筋戦略をあまり変えなくなりました。これは機械の方が人間より速く動きすぎてついていけないことを示唆します。復号器の努力罰則を変えることは別の調整手段となりました。罰則を高くすると復号器はあまり力を使わなくなり、その結果、多くのユーザーが精度を保つために自ら筋力を増す傾向がありました。興味深いことに、参加者間で努力とカーソル速度のバランスの付け方に差があり、ある者は速さを維持するためにより多く努力し、別の者は努力を節約するために遅い動きを受け入れるなど、個人の好みが見られました。これは将来のインタフェースが個別化できる余地を示唆します。

将来の神経インタフェースにとっての意義

端的に言えば、本研究は神経インタフェースの学習規則が単に雑音を除去する以上の役割を担い、人が機器の使い方を学ぶ過程そのものを能動的に形作ることを示しています。厳密なモデリングと人間の実験を組み合わせることで、著者らは復号器の学習率、努力罰則、初期化を試行錯誤ではなく原理に基づいて選ぶためのツールキットを提供します。彼らのフレームワークは、正確であるだけでなく安定で快適、かつ各ユーザーの学習スタイルに合わせて調整された次世代の義肢、リハビリ機器、脳–コンピュータインタフェースの設計を導く可能性があります。

引用: Madduri, M.M., Yamagami, M., Li, S.J. et al. Computational framework to predict and shape human–machine interactions in closed-loop, co-adaptive neural interfaces. Nat Mach Intell 8, 372–387 (2026). https://doi.org/10.1038/s42256-026-01194-z

キーワード: 神経インタフェース, 人間と機械の相互作用, 共適応制御, 筋電位によるカーソル制御, 脳–コンピュータインタフェース設計