Clear Sky Science · ja

大規模言語モデルを用いた電子カルテにおける移動機能状態の検出

2026-01-23 · 一覧に戻る

歩行能力が強力な健康指標である理由

人々が長く生きるようになるにつれ、医師は単に寿命だけでなく、どれだけ動けるか、歩けるか、自分で身の回りのことができるかにもより注目するようになっています。椅子から立ち上がるのが難しい、階段を上るのがつらい、外出が困難といった問題は、医療危機のずっと前から現れることがよくあります。しかし、日常生活での細かな能力の記述は大抵、電子カルテ内の医師や理学療法士、作業療法士による自由記述のノートに埋もれており、コンピュータが見つけるのは難しいです。本研究は、今日の大規模言語モデル—多くのチャットボットの背後にあるのと同種のAI—がこれらの記載を安定して読み取り、運動に関する記述を構造化された検索可能な情報に変えられるかを検証します。

乱雑なノートを使える移動性データに変換する

研究者らは「移動機能状態」という広い概念に注目しました。これは姿勢変換、歩行、物の運搬・取り扱い、交通機関の利用、日常生活での移動能力がどれほどかを指します。対象としてミネソタ州とウィスコンシン州の3つの医療機関から得た実際の臨床ノート600件を用い、大部分は理学療法・作業療法の訪問記録で、一般外来のノートも含まれていました。専門のアノテータが各ノートを節ごとに精査し、5つの移動カテゴリのいずれかを記述する部分をすべてラベル付けし、患者が明らかに制限されているか（「障害あり」）、通常どおり機能しているか（「障害なし」）を示しました。これらの専門家ラベルがAIシステムの評価におけるゴールドスタンダードとなりました。

臨床家のように読むようAIモデルを学習させる方法

チームはオープンソースの大規模言語モデルであるLlama 3を使用し、患者データが医療機関の外に出ないよう安全なローカルサーバー上で実行しました。モデルを最初から再学習させる代わりに、モデルに何を探すべきかを教えるためにプロンプト（指示文と定義のセット）を慎重に設計しました。指示のみを与える「ゼロショット」プロンプトと、少数の例文を含める「フューショット」プロンプトを試し、その後モデルの誤りを分析して、何を含めるか、将来の治療計画のように無視すべきものは何か、転倒やめまい、車椅子使用等の扱いに関する注意点などを明確にした「誤りに基づく」プロンプトを作成しました。AIには各ノートの節ごと、そして各移動カテゴリごとに、移動性が言及されているかどうか、言及されている場合は患者が障害を持っているかどうかを答えるよう求めました。

患者レベルでの強い性能向上

専門家ラベルと比較したところ、洗練されたシステムは良好な成績を示しました。個々の患者レベル—その患者の全ノートの情報を統合した場合—では、移動情報を単に検出するタスクでF1スコア（一般的な精度指標）が約0.88、患者が障害を抱えているか判断するタスクで0.90に達しました。これはAIの判断が人間のレビュアーの評価とよく一致していることを示します。文言が乏しかったり曖昧な節単位では性能がやや低下しましたが、ノート単位、さらに患者の全ノートを統合するほど精度は向上しました。別の解析では、「臨床的に妥当な推論」を正解と見なすと、例えば歩行時の重度の膝痛が明示的に歩行制限と書かれていなくても歩行を制限すると推定するなど、このより寛容な評価では、患者レベルのF1スコアは抽出で0.96を超え、障害判定で0.95を超えました。

AIが間違えた点—そしてそれが依然重要な理由

誤りの大部分はモデルの行間を読む傾向から生じました。痛みやめまい、将来の治療計画から移動問題を推測することが多く、ノートに患者が明確に制限されていると書かれていない場合でもそう判断してしまいました。他の誤りは定義のグレーゾーンに由来します。例えば、繰り返す転倒を歩行の問題とみなすべきか、姿勢変換時のバランスの問題とみなすべきかといった点です。「移動性、不特定」は日常活動や運動をとらえるためのクラスですが、特に定義づけが難しかったです。それでも、これらの間違いはランダムや奇異なものではなく、臨床的観点からは概して合理的でした。モデルを決定論的に（ランダム性を組み込まず）ローカルサーバーで実行することで、結果の再現性を確保し、患者のプライバシーも守られました。

高齢者ケアをどう変えうるか

一般向けに言えば、AIシステムは日常的な医師や療法士のノートを十分に読み取り、患者のどこが動きにくいかを要約できるようになった、ということです。これにより、医療機関は新たな問診票や検査を追加することなく、時間経過に伴う歩行やバランス、日常活動の変化を追跡したり、転倒や入院のリスクが高い人を検出したり、理学療法や自宅の安全評価が有益そうな人を特定したりできます。数百万件の自由記述ノートを構造化された移動性データに変換することで、このアプローチは加齢や病気が日常生活に与える影響の全体像を医師が把握するのに役立ち、医療をより個別化され機能を中心としたものに近づけます。

引用: Liu, X., Garg, M., Jia, H. et al. Mobility functional status ascertainment in electronic health records using large language models. Sci Rep 16, 6045 (2026). https://doi.org/10.1038/s41598-026-37025-9

キーワード: 移動性, 電子カルテ, 大規模言語モデル, 機能的状態, 臨床AI