Clear Sky Science · ja
軸位および矢状位MRIデータを用いた多平面ビジョントランスフォーマーによる出血分類
患者と医師にとってこの研究が重要な理由
脳卒中や頭蓋内出血が疑われる場合、時間は最も重要です。脳の画像検査は危険な出血を示すことがありますが、特に磁気共鳴画像(MRI)は多様な撮像コントラストや異なる視点の画像を多数生成するため、迅速かつ正確に読影するのは難しいことがあります。本研究は、実臨床の病院環境で脳出血をより確実に検出することを目標に、熟練した放射線科医のように多角的なMRIを読み取ることを意図した新しい人工知能(AI)手法を紹介します。
MRIで脳出血を見つけることの難しさ
頭蓋内出血――頭蓋内での出血は生命を脅かす緊急事態であり、迅速な診断が求められます。何十年にもわたり、計算機断層撮影(CT)は迅速で解釈が比較的容易なため、疑われる脳出血の主要な画像検査手段でした。MRIは出血の検出においてCTに匹敵し、場合によってはそれを上回ることがあり、出血の古さを示したり、血流不足の領域など他の病変を明らかにする点で優れています。しかし、MRIは撮像に時間がかかり、一部の施設では利用が限られ、画像の解釈はより複雑です。この複雑さが、スクリーニングで多数の検査を支援し、疑わしい症例をフラグ化し、微小だが重要な出血の見落としリスクを低減するAIツールの開発対象として魅力的にしています。
複数の視点や撮像タイプがコンピュータにとって難しい理由
日常の臨床では、検査時間を短くするために比較的厚いスライスで脳MRIが取得されることが多く、ある方向には非常に高解像で、別の方向にはそうでない画像が生成されます。放射線科医は脳を複数の面(軸位:上から、矢状位:側面、場合によっては冠状位:前面)で観察します。というのも、ある出血は特定の角度から見ると見つけやすいからです。また、FLAIR、拡散強調、感受性(出血に敏感なシーケンス)など複数の「コントラスト」や種類の画像があり、それぞれが異なる組織特性を際立たせます。しかし多くの既存AIシステムは、すべての画像が単一の標準方向で同一解像度に揃っていることを前提としています。この要件を満たすために、病院側でデータを回転・リサイズすると微細な特徴がぼやけ、小さな出血が隠れてしまう可能性があります。さらに実臨床データでは、すべての患者が同じ種類のコントラストで撮影されるわけではないため、モデルは情報の欠落に対処する必要があります。
より多くの情報を残す多平面AIモデル
これらの問題に対処するために、著者らは「多平面ビジョントランスフォーマー(MP-ViT)」を設計しました。これは元来自然画像理解のために開発されたAIの一種です。すべてのMRIデータを一つの視点に無理に揃える代わりに、MP-ViTは軸位画像用と矢状位画像用の2つの専用処理ブランチを備えています。各ブランチは三次元の脳を小さなブロックに分割し、それらをトランスフォーマーが処理できるトークンに変換して、出血の存在を示す可能性のあるパターンを学習します。重要なのは、これらのブランチが単に並列で独立して処理を続けるわけではない点で、モデルはクロスアテンション機構を使用して両ブランチ間で情報を交換します。これは放射線科医が異なる角度の所見を心の中で組み合わせて脳の全体像を明瞭にする過程を模倣しています。

欠損する撮像タイプへの対応とガイダンス信号
実際の病院ワークフローでは、すべての患者が同じMRIコントラストで撮像されるわけではなく、出血感受性の特殊なシーケンスなど一部の系列が欠けることがあります。こうしたギャップに対してAIを堅牢にするため、著者らは「モダリティ指示ベクトル」を追加しました。これは、ある患者にどの種類の画像が存在し、どれが欠けているかをモデルに知らせる単純なコードです。このベクトルは内部信号群に変換され、追加のクロスアテンション段を通じてモデルの学習済み特徴と相互作用します。結果として、ネットワークは特定の情報が利用できない場合に期待値を調整するよう導かれ、混乱したり過度に自信を持ったりすることを避けます。この設計により、MP-ViTは日常の臨床で生じる不揃いで雑然としたデータに適したものになっています。

新手法の性能
研究者らは、3大メーカーのスキャナーから得られた12,000件超の実世界MRI検査データセット(経験豊富な放射線科医により急性または亜急性頭蓋内出血あり/なしにラベル付け)でMP-ViTを訓練・評価しました。独立したテストセットにおいて、MP-ViTは0.854のAUC(曲線下面積)を達成しました。AUCはすべての意思決定閾値にわたり出血と非出血をどれだけ分離できるかを示す指標です。このスコアは、単一平面から動作する標準的なビジョントランスフォーマーや、ResNetやDenseNetといったいくつかの既知の畳み込みニューラルネットワークと比較して有意に高かったです。統計検定により、これらの改善が偶然による可能性は低いことが示されました。内部解析では、モダリティ指示ベクトルを含めることで性能が1ポイント以上向上したことも示され、どの撮像タイプが手元にあるかを明示的に知らせることの価値が裏付けられました。
将来の医療にとっての意義
非専門家にとっての主要な結論は、本研究がMRIを読むAIのより賢い方法を示したことです:複数の角度から脳を観察し、元の細部をより多く保持し、ある種類の画像が欠けているときに適応します。本研究は単一の内部データセットで評価され、出血の正確な輪郭抽出ではなく分類に焦点を当てている点に制約がありますが、注意深く設計されたトランスフォーマーが臨床画像の雑多な現実により適合し得ることを示しています。より広範な妥当性確認と病院のワークフローへの責任ある統合がなされれば、MP-ViTのような手法は救急の脳卒中対応や日常の外来検査の両方で放射線科医が脳出血をより確実に検出する助けとなり、より迅速な治療と患者の安全な転帰に結びつく可能性があります。
引用: Das, B.K., Zhao, G., Mailhe, B. et al. Multi-plane vision transformer for hemorrhage classification using axial and sagittal MRI data. Sci Rep 16, 9333 (2026). https://doi.org/10.1038/s41598-026-44524-2
キーワード: 脳出血, MRI, 医療画像AI, ビジョントランスフォーマー, 脳卒中診断