Clear Sky Science · ja

フェデレーテッドラーニングとトラベリングモデルの併用が性能を高め、デジタルヘルスの公平性に道を開く

· 一覧に戻る

データを共有せずに医療知見を共有することが重要な理由

現代医療は、スキャン画像や診療記録の中からパターンを見出すために、人工知能にますます依存しています。しかし患者データは機微な情報であり、多くの場合、それが収集された病院から外部に出すことはできません。ここに緊張が生じます。生の患者データを国境を越えて、あるいは大規模な中央サーバーに送らずに、世界中の病院が協力して強力なAIツールを訓練するにはどうすればよいか。本研究は、そのための新しい方法を提示し、精度だけでなく、資源が豊富な大規模病院と小規模で資源に乏しい診療所との間での公平性も目指しています。

データを動かさずにAIを学習させる二つの方法

現在、病院がデータを現地に留めたまま共同でAIを訓練するための主要な戦略は二つあります。フェデレーテッドラーニングでは、各病院が並行してモデルのローカルコピーを訓練し、これらのローカルモデルを中央サーバーで統合して共有の“グローバル”モデルを作ります。トラベリングモデルのアプローチでは、モデルは一つだけで、それが病院から病院へ順に移動して各サイトで訓練されます。両者ともプライバシーを保護しますが、欠点もあります。フェデレーテッドラーニングは、一部の病院がデータ不足であったり患者層が偏っていたりすると苦戦することがあり、弱いまたは不均衡なローカルモデルを統合すると大規模で裕福なサイトを主に反映する粗いグローバルモデルになる可能性があります。トラベリングモデルはこれらの不均衡に対してより頑健ですが、遅く管理が難しくなることがあります。

Figure 1
Figure 1.

両手法の長所を組み合わせたハイブリッド戦略

著者らはFedTMと呼ばれる、フェデレーテッドラーニングとトラベリングモデルの強みを組み合わせたハイブリッドな学習スキームを提案します。訓練は二段階で行われます。まず「ウォームアップ」段階では、データが比較的充実しておりバランスの良い大規模病院だけが標準的なフェデレーテッドラーニングの手法で並行してモデルを訓練します。これにより強固な出発点となるモデルが作られます。その後の「洗練」段階では、このウォームアップ済みモデルが順にすべてのサイトを訪問し、ごく少数の脳スキャンしか持たない小規模クリニックや患者が一人しかいないような施設も含めて訓練を受けます。第二段階では、モデルは移動しながら各サイトの知見を段階的に取り入れて更新されますが、各サイトのデータが外部に出ることは決してありません。

パーキンソン病の脳スキャンで手法を検証

FedTMを検証するために、研究者たちは世界83カ所の医療画像サイトから集めた1,817件の脳MRIスキャンを用いて、パーキンソン病患者と健康な被験者を識別するAIシステムを訓練しました。これは特に厳しい条件です。サイトの半数以上が10件未満のスキャンしか寄与せず、およそ3分の1程度しか患者と健常コントロールの両方を持たず、撮像プロトコルも大きく異なっていました。こうした現実的な条件下では、純粋なフェデレーテッドラーニングは課題をうまく学習できず、純粋なトラベリングモデルはより良い結果を示したものの改善の余地が残りました。FedTMは、特にウォームアップに7つの最大かつ最もバランスの良いサイトを含めた場合に、両者を明確に上回りました。ROC曲線下面積(AUC)という分類性能の標準指標は、トラベリングモデル単体の約77%からFedTMで約82%に上昇し、感度、特異度、F1スコアなど他の臨床的に重要な指標でも同様の改善が見られました。

Figure 2
Figure 2.

大規模病院と小規模病院の間でAIをより公平にする

医用AIにおける大きな懸念は公平性です:モデルは小規模で地方にある、あるいは資源の乏しい病院の患者に対しても、大規模な研究病院の患者と同じように機能するか。チームは「大きい」サイトと「小さい」サイトで誤分類がどの程度発生するかを調べました。トラベリングモデル単体では、これらのグループ間で誤分類率に約8ポイントの差がありました。適切に調整したFedTMでは、大規模サイトと小規模サイトの誤分類率はほぼ同一の約26%になりました。言い換えれば、モデルは全体の精度が向上しただけでなく、より均衡な性能になったのです。さらにFedTMは重い計算負荷の多くを資源の豊富なサイトでのウォームアップ段階に移すため、小規模サイトが実行する必要のある訓練サイクル数をほぼ半減させつつ、総訓練時間は同程度に保ちました。

グローバルなデジタルヘルスにとっての意義

FedTMは、プライバシーを尊重し、性能を向上させ、恩恵をより公平に共有するAIツールへの実用的な道筋を提供します。データが非常に少ないサイトでさえ最終モデルに影響を与えられるようにすることで、この枠組みは資源に乏しい地域や遠隔地の人々が新しい診断ツールの開発から取り残されないことに寄与できます。本研究は単一の種類の脳スキャンと一つの疾患に焦点を当てましたが、このアプローチは原理的には多くの他の医療問題にも適用可能です。医療システムがモバイル機器やウェアラブルをますます採用し、データ主権を重視する規制が強まる中で、FedTMのようなハイブリッド戦略は、信頼できる包摂的で責任ある医用AIを構築するための重要な鍵となる可能性があります。

引用: Souza, R., Stanley, E.A.M., Ohara, E.Y. et al. Combining federated learning and travelling model boosts performance and opens opportunities for digital health equity. npj Digit. Med. 9, 294 (2026). https://doi.org/10.1038/s41746-026-02483-y

キーワード: フェデレーテッドラーニング, トラベリングモデル, パーキンソン病, 医用画像AI, ヘルス・エクイティ