Clear Sky Science · ja

Screenathon 2.0:患者生成ヘルスデータに適用される人間とAIの協働スクリーニング

· 一覧に戻る

日常の健康研究にとってなぜ重要か

現代医療は、何が本当に効果的かを見極めるために大量の科学論文を精査することに依存しています。しかし、新しい研究の量は非常に増大しており、組織化された研究チームでさえ追いつくのが難しくなっています。本稿は、人と人工知能(AI)が協力して論文の「スクリーニング」を加速しつつ、人間の判断を主導に置き続ける新しい方法を説明します。Screenathon 2.0と呼ばれるこの手法は、多数の専門家と賢いソフトウェアが協働して、膨大な読書作業を数日で処理できることを示しています。

Figure 1
Figure 1.

個人作業からチームプレーへ

従来、研究者は少なくとも2人で各論文のタイトルと要旨を読み、その研究質問に合致するかを判断することでシステマティックレビューを行ってきました。この入念なプロセスは信頼できる結論を保証しますが、論文数が急増する中で非常に遅く、スケールしにくいという問題があります。以前、この研究グループはスクリーニングを「Screenathon」に変えて、数十人の専門家が数日間並んで作業を分担する試みを行いました。最初のイベントはチーム作業の有用性を示しましたが、それでも完全に人力に依存しており、疲労、経験のばらつき、ラベリングミスからは完全には逃れられませんでした。

助っ人としてのAIの導入

Screenathon 2.0では、チームはAIをワークフローに直接組み込むことでプロセスを改良しました。対象は、フィットネストラッカーや血糖測定器、ヘルスアプリなど、人々が自ら収集する情報である患者生成ヘルスデータに関する研究です。オープンソースプログラムASReviewを用い、AIモデルは人間のレビュワーが下す判断からリアルタイムで学習しました。人が論文を関連あり/なしとマークするたびに、システムは内部ルールを更新し、残りの論文を並べ替えて有望なものを先に並べました。こうして人間は意思決定の主体として残り、AIはどの論文を次に確認すべきかを示す逐次的に改善する案内役として機能しました。

2日間の大規模実験

研究者たちは、この人間とAIの協働を欧州の保健コンソーシアムの3日間の会合で試験しました。27の加盟組織から27人の専門家が参加し、がんから心疾患、神経障害までの11の疾患領域にまたがる約7,000件の記録をスクリーニングしました。初日には参加者に包含基準の訓練とAIシステムの仕組みの紹介が行われ、2日目には集中的な共同スクリーニングに注力し、非公式に共用スペースで作業を続けることもありました。最終的に関連ありとラベリングされた記録は487件、不関連は6,000件超に達し、ある人は少数の論文しか、別の人は数千件を処理するなどばらつきがありつつも、それぞれの疾患トピックに対する共有AIモデルに結果が反映されました。

Figure 2
Figure 2.

機械と人間の出力を検証する

重要な研究が見落とされるなら速度だけでは無意味になるため、チームは堅牢な「アフターケア」段階を設けました。本イベント終了後、数週間をかけて結果の確認と精緻化を行いました。誤って割り当てられた疾患グループの論文を再振り分けし、不確かなケースを再読し、厳格な停止ルールを用いて追加のスクリーニングを実施しました(例えば、連続する多くの不関連記録が出現するまで継続するなど)。最後に、以前に除外された記録のうち誤ってラベル付けされた可能性のあるものを再検討する特別な方法を用いました。この入念なクリーンアップ段階により、トピック全体で200件以上の追加の関連研究が見つかり、迅速なAI支援スクリーニングでも徹底した品質管理と両立できることが示されました。

AIと協働した人々の感想

イベント期間中、参加者は自信、動機、AI支援レビューへの信頼についてアンケートに回答しました。全体として高い動機付けと満足度が報告され、参加者の半数以上が従来型のみの方法よりAI支援スクリーニングを好むと答えました。重要なことに、実際にシステムを使った後でAI支援レビューへの信頼が高まったことが示されました。多くの参加者はソフトウェアのシンプルさと明瞭さを評価しましたが、より良いフィルタリング機能やAIがどのように論文を優先しているかを示す透明性の高い視覚的手がかりなど、改善点も提案しました。

この新しいアプローチが示すもの

一般読者にとっての主要なメッセージは、医療研究に追いつく課題は人間と機械のどちらかを選ぶ必要がないということです。Screenathon 2.0は、専門家の判断と適応的なAIを組み合わせることで、研究チームが最も関連性の高い研究を迅速に見つけられ、注意深さと監視を犠牲にすることなく実現できることを示しています。AIは探索を加速しますが、最終判定は人間が行い、結果を検証します。十分な訓練と堅牢な事後チェックを伴えば、この種の人間–AIパートナーシップは、ヘルス情報が増え続ける中で、エビデンス収集をより速く、より信頼でき、より持続可能にする可能性があります。

引用: Bergmann, J., Azzi, T., Neeleman, R. et al. Screenathon 2.0: human–AI collaborative screening applied to patient-generated health data. Sci Rep 16, 14487 (2026). https://doi.org/10.1038/s41598-026-45385-5

キーワード: システマティックレビュー, 人間とAIの協働, 患者生成ヘルスデータ, アクティブラーニング, 文献スクリーニング