Clear Sky Science · ja

腫瘍学試験の適格性事前スクリーニングの正確性と効率を高めるための人間–AIチーミング:回顧的電子健康記録を用いたランダム化評価試験

· 一覧に戻る

適切な患者を見つけることが重要な理由

多くのがん患者にとって、臨床試験へ参加することは最新の治療やより良い転帰への道を開く可能性があります。それでも、成人のごく一部しか臨床試験に登録しません。主要なボトルネックの一つは、患者が同意書に署名するずっと前に起きます。スタッフはまず、誰がそもそも適格かを判断するために、長く散発的な医療記録を掘り下げる必要があるのです。本研究は、人間の専門家と人工知能システムを組ませることで、その初期スクリーニングがより正確になり、処理速度が落ちないかを問いかけます。

現在の試験スクリーニングの仕組み

がん試験に参加する前に、臨床研究スタッフは腫瘍の種類、病期、検査結果、日常の機能状態など、数十に及ぶ詳細な登録条件を満たすかどうかを判断しなければなりません。これらの情報の多くは、放射線画像レポート、診療記録、検査結果要約といった非構造化のノートに埋もれており、しばしば冗長で不完全、あるいは矛盾しています。これらの文書を手作業で精査するのは遅く骨の折れる作業で、経験豊富なスタッフでも重要な詳細を見落とすことがあります。その結果、適格な患者が特定されないままになり、生命を延ばす可能性のある選択肢が失われることがあります。

研究者たちが検証したこと

AIが役立つかを調べるために、チームはコミュニティ診療で治療を受けた肺がんまたは大腸がんの355人分の電子記録を使用しました。腫瘍の病期、特定のバイオマーカー、既往治療への反応、基本的な健康状態など、12項目の一般的な試験基準に着目しました。専門の「ニューロシンボリック」言語システムがまずスキャンされたカルテをテキストに変換し、検査結果や病期の詳細などの構造化された事実を抽出しました。その後、訓練を受けた2名の研究コーディネーターが各カルテを二度ずつレビューしました——一度は画面上にAIの提案が表示された状態(Human+AI方式)、もう一度は提案なしの状態(Human-alone方式)で、順序はランダムでした。正確性を評価するために、別の臨床医グループが既に各カルテの「ゴールドスタンダード」解答を作成していました。

Figure 1
Figure 1.

人間–AIチームの成績

人間とAIが協働した場合、ゴールドスタンダードの解答と一致する頻度は、人間のみの場合より高くなりました。全体として、Human+AIチームは約4分の3の項目を正しく判断したのに対し、人間のみでは約7割強で、AI単独よりもはるかに良好でした。最大の改善は、バイオマーカー検査とその結果、腫瘍の正確な病期判定、以前の治療への反応といった難しい領域で見られました。これらのカテゴリでは、大量のテキストをふるいにかけるAIの強みがコーディネーターに見落としがちな情報を示し、人間がAIの誤りを訂正し不確かな事例を解釈することで相互補完が働きました。

速度、トレードオフ、そして人間のバイアス

驚くべきことに、AIを加えても処理が速くなることはありませんでした。両方式ともカルテ1件あたり平均で約30分強かかりました。著者らは、時間の節約ではなく、AIがコーディネーターの作業の性質を変えたのではないかと述べています。つまり、すべての詳細を自分で探す代わりに、AIが示した項目を確認・解釈する作業により多くの労力を費やすようになったということです。これはむしろ健全な安全策であり、人が機械の回答を無条件に受け入れてしまうリスクを減らしている可能性があります。研究では協働がうまくいかない場面も調べています。ある機能評価の尺度ではAIが不安定で、AI出力に過度に依存したレビューアはやや成績が悪くなりました——これは「自動化バイアス」を示すサインです。一方で、人間が正確なAIの信号を十分に活用していないと思われる領域もあり、初期印象に合う情報を好む「確証バイアス」を示唆しています。

Figure 2
Figure 2.

将来のがん医療にとっての意味

簡潔に言えば、この試験は人とAIがよく設計された形で協働すれば、初期の試験スクリーニングの正確性をやや向上させつつ速度を落とさない可能性があることを示しています。改善の程度は控えめですが、バイオマーカーの状態や正確な病期判定のように、しばしば患者が試験に入れるかどうかを左右する複雑な詳細に集中しています。こうしたシステムがさらに洗練され、実際の臨床ワークフローで試験されれば、より多くの適格患者を発見し、先端的ながん治験へのアクセスを広げるのに役立ち、最終判断を人間がしっかり掌握したまま実現できるでしょう。

引用: Parikh, R.B., Kolla, L., Beothy, E.A. et al. Human-AI teaming to improve accuracy and efficiency of eligibility criteria prescreening for oncology trials: a randomized evaluation trial using retrospective electronic health records. Nat Commun 17, 2306 (2026). https://doi.org/10.1038/s41467-026-68873-8

キーワード: がん臨床試験, 電子健康記録, 人工知能, 患者の適格性, 人間とAIの協働