Clear Sky Science · ja
外科および介入的ビデオ解析における人工知能と医療従事者の性能比較:系統的レビューとメタ解析
手術室のより賢い目
毎年、数億人がコロノスコピーや内視鏡手術、血管内に挿入する小型カメラなど、ビデオで導かれる手術や低侵襲処置を受けています。こうした場面では、画面上の微妙な異常を医師が見つけられるかどうかが、がんを早期に発見できるか見落とすかの差になることがあります。本研究は、手術や介入のビデオ解析において、人工知能システムは臨床医と比べてどれほどの性能を示すのか、そして両者が協働したときに何が起きるのかという、将来の患者にとって重要な問いを投げかけます。

あふれる手術ビデオに秩序をもたらす
現代の医療は、消化器内視鏡からロボット支援手術に至るまで膨大な数の処置ビデオを記録しています。これらの記録には豊富な情報が含まれており、結腸の小さなポリープ、胃や食道の早期腫瘍、避けるべき微細な神経、あるいは複雑な手術の手順などが写っています。研究者たちはこうした画像をスキャンして疑わしい領域を検出し、術中の位置を認識するなどのためにAIシステムを訓練してきました。しかしこれまでの多くの研究は、AIと医師を人工的な一対一の対決に置くことが多く、現実的に技術がどのように用いられるか――臨床医のそばで補助する存在として――を問うことは少なかった。本レビューは、多くの専門分野に散らばるそのような証拠を系統的に集め、分析することを目的としました。
研究者が調べたもの
研究チームは主要な医療および工学データベースを検索し、約3万8千件の論文を出発点としました。厳格な基準を適用した結果――実際の手術または介入ビデオにAIを適用し、その性能を医療専門家と直接比較した一次研究のみ――146件の研究が残りました。これらは消化器内視鏡をはじめ、肺、甲状腺、脳、心臓、泌尿器科の介入など幅広い手技を網羅していました。大半は畳み込みニューラルネットワークなどの現代的な深層学習手法を用い、疾患検出、解剖学の認識、腸内の清潔度評価、手術手順の同定などを目的としていました。うち76件は結果を統合し、AIと人間の正誤率を算出するのに十分な詳細を報告していました。
単独のAI対医師、そしてAIを仲間とした場合
研究者らが同じビデオを見た無支援の臨床家とAIを比較したところ、AIは一般に真の異常をより多く検出する(感度が高い)一方で誤検出を増やすことはなく(特異度は同程度)、優れた成績を示しました。この傾向は、モデルが馴染みのデータで評価された場合も、新しい外部データセットに直面した場合も一貫していました。しかし、臨床的に最も重要な所見はAIを補助として用いたときに得られました。幅広いタスクで、AIの示唆を見ることができる臨床家は、単独で作業する者よりも疾患を見つける能力が高く、正常組織を誤分類する可能性が低くなりました。この向上は、研修医などの非専門家で特に顕著で、AIの助言から最も大きな恩恵を受けていました。熟練した専門家においては、AI支援と単独のAIの性能は概ね同等であり、専門家の手にかかれば人間と機械の組合せは最良の単独アルゴリズムに匹敵しうることが示唆されます。
実験室条件と現実の間のギャップ
これらの有望な数値にもかかわらず、本レビューはAIの現在の試験方法と実際の臨床環境で必要とされる働きとの間にギャップがあることを強調します。多くの研究がぼやけたフレームや低品質の映像を除外してデータを精製しており、実際の手術室や内視鏡室ではまさにそのような欠陥に対処する必要があるにもかかわらずです。ほかには連続したビデオではなく単独の静止画を解析し、動きやタイミングを追跡する課題を回避している例もありました。ベッドサイドでリアルタイムにAIを評価した研究は少なく、高価な機器に依存する研究が多く、資源の限られた病院では入手できない場合があります。報告の方法も一貫性に欠け、モデルの調整や検証に関する重要な詳細が欠落していることが多く、他者が再現したり公正に評価したりするのが困難になっています。

信頼できる人間―AIパートナーシップの構築
筆者らは、外科および介入医療におけるAIは代替ではなく臨床家のパートナーとして初めから開発・評価されるべきだと主張します。それは現実世界の条件を反映した研究設計、多施設にまたがる多様なビデオデータセットの共有、他チームが検証・改良できるような明確な報告基準の採用を意味します。また、臨床家がAIの強みとバイアスを理解する教育を受け、盲目的に信頼したり一蹴したりするのではなく適切に活用できるようにすることも重要です。メタ解析は、AIが多くのビデオベースのタスクで無支援の人間の性能に匹敵または上回ることをすでに示している一方で、最も意義深い利得は人間の判断を磨く点にあります。患者にとっての要点は、機械が手術室を支配するのではなく、慎重に設計された人間―AIのチームが手技をより安全にし、診断を早め、転帰を改善する可能性があるということです。
引用: Rafati Fard, A., Williams, S.C., Smith, K.J. et al. Comparing artificial intelligence and healthcare professional performance in surgical and interventional video analysis: a systematic review and meta-analysis. npj Digit. Med. 9, 323 (2026). https://doi.org/10.1038/s41746-026-02401-2
キーワード: 手術ビデオAI, コンピュータ支援内視鏡, 人間―AIの協働, 医用画像解析, 臨床意思決定支援