Clear Sky Science · ja

Efficient SqueezeViT: 胸部X線画像分類のための軽量ビジョントランスフォーマーフレームワーク

2026-04-09 · 一覧に戻る

なぜ胸部X線読影の高速化が重要か

胸部X線検査は、肺炎や結核など肺や心臓の問題を確認する最も一般的な手段の一つです。人手の多い病院や計算資源が限られた小規模な診療所では、こうした画像を素早く読み取るのを助ける大規模な人工知能ツールを稼働させるのは困難です。本研究はSqueezeViTと呼ばれる新しいコンパクトなAIモデルを提示しており、従来のシステムよりもはるかに少ない計算資源で胸部の疾患を検出できるよう設計されており、実臨床での実用性を高めます。

スマートな画像認識を小さくする新しい方法

現代の画像認識ツールはたいてい二つの考え方に依存します。畳み込みニューラルネットワークは画像の小さな領域における細かな特徴を捉えるのが得意で、トランスフォーマーモデルは画像全体にわたる大局的な関連を見るのが得意です。しかし標準的なビジョントランスフォーマーは重くて遅くなりがちです。著者らは、トランスフォーマーの広い視野を維持しつつ、各ステップで処理すべき情報量を「絞る」ようSqueezeViTを設計しました。診断に重要な画像の部分を残しつつ、余分な計算を削って控えめなハードウェアで動作することを目指しています。

Figure 1. コンパクトなAIは、低電力の医療機器上でも胸部X線画像を正確に分類するのに役立ちます。

コンパクトモデルは肺と心臓をどう見るか

SqueezeViTは胸部X線を効率的に扱うために二つの構成要素を組み合わせています。第一の要素「Fireブロック」は画像から得られる情報をより小さな特徴集合に圧縮し、再び拡張して疾患に関連するエッジやテクスチャなどのパターンを際立たせるスマートなフィルターのように働きます。第二の要素「Translutionブロック」は画像を小さなパッチに分割してアテンションを適用し、肺や心臓の離れた領域間の信号を関連付けられるようにします。従来よりやや大きめのパッチを使うことで、アテンション処理の負担を減らしつつ、胸部の一部での変化が他の部位とどう結びつくかを捉え続けます。

システムの実地評価

SqueezeViTが実際にどれだけ有効かを評価するため、研究者らはNIHのChestX-ray14データセットとCheXpertデータセットという二つの大規模な公開胸部X線コレクションで検証しました。これらは合わせて心拡大、浮腫、肺炎、肺結節など複数の疾患ラベルを持つ数十万枚の画像を含みます。チームはSqueezeViTをゼロから学習させ、ResNetやDenseNetといった大型モデルからMobileNet、ShuffleNet、SqueezeNet、MobileViTといった軽量モデルまで、よく知られた深層学習モデルと比較しました。評価は受信者動作特性曲線下面積（AUC）を中心に行い、異なる閾値で異常を正常より上位にランク付けできる能力を重視しました。

Figure 2. 軽量化されたAIは、胸部X線の画像情報を段階的に圧縮して肺の異常を検出します。

速度、サイズ、精度のバランス

結果は、SqueezeViTが多くのタスクで大規模モデルに匹敵するかそれ以上の精度を達成しつつ、はるかに小型であることを示しています。学習可能なパラメータは約50万程度で、MobileViTと比べてパラメータ数を40％以上削減し、最大級のベースラインと比べれば90％超の削減を実現しています。演算量、メモリ使用量、GPUおよび標準CPUでの処理遅延もいずれも小さく、典型的なハードウェアでは数ミリ秒で画像を解析できます。複数疾患の設定では、多くの疾患で最良の重いモデルに匹敵するか僅差で追随し、他の軽量設計を明確に上回りました。単純な正常対異常の判定でも、両データセットで一貫して高いスコアを示しました。

日常診療における意義

専門的な背景がない読者に向けた要点は、SqueezeViTが計算資源を節約しつつも慎重に疾患を検出できる胸部X線向けAIアシスタントを構築可能であることを示した点です。放射線科医や臨床医の役割を不要にするものではありませんが、混雑した病院で疑わしいスキャンをより速くフラグ付けしたり、設備の乏しい診療所でも高度な画像解析を提供したりする助けになる可能性があります。著者らは実臨床のラベルにはノイズがあることや一部の疾患カテゴリが依然として難しいことを指摘していますが、このコンパクトな設計は胸部画像の信頼できる携帯型支援ツールに向けた有望な一歩であり、将来的にはCTやMRIなど他の撮像法へ適用できる可能性があると示唆しています。

引用: Maurya, A., Lohia, A., Chirag et al. Efficient SqueezeViT: A lightweight vision transformer framework for chest X-ray image classification. Sci Rep 16, 16183 (2026). https://doi.org/10.1038/s41598-026-47918-4

キーワード: 胸部X線AI, ビジョントランスフォーマー, 医用画像解析, 軽量ディープラーニング, 肺疾患検出