Clear Sky Science · ja

ModernBERTは日本語放射線科レポートにおける胸部CT所見分類で従来型BERTより効率的である

2026-04-03 · 一覧に戻る

なぜ医療レポートをより速く読むことが重要か

病院では毎日、スキャンで見られた所見を記した何千もの放射線科レポートが作成されます。これらの自由記述を構造化情報に変換することは、研究や品質管理、さらには診断支援を行う将来のAIシステムに役立ちます。しかしコンピュータがまず言語を「理解」する必要があり、日本語の医療記述は専門用語、略語、英語表現の混在により特に難しい。本研究は、ModernBERTと呼ばれる新しい言語モデルが、従来広く使われてきたBERTモデルよりも日本語の胸部CTレポートを効率よく読み取れるか、精度を損なわずに可能かを問います。

コンピュータがスキャンレポートを読む学び方

モデルを公平に比較するために、研究者らは具体的なタスクに着目しました：各胸部CTレポートについて、肺結節、肺気腫、胸水などの18種類の所見のうちどれが存在するかを判定することです。彼らはCT-RATE-JPNという大規模な公開データセットを使用しました。これは専門家がラベル付けした2万2千件超の日本語翻訳胸部CTレポートを含みます。ほとんどのレポートは3つのモデル――標準的なBERT、医療特化型のJMedRoBERTa、そしてModernBERT――の訓練と調整に使われ、別に用意した150件のレポートで各モデルが正しい所見の組み合わせをどれだけ割り当てられるかを評価しました。

Figure 1. AIモデルは日本語の胸部CTレポートを肺所見の構造化リストにより速く、効率的に変換します。

より厳しい実世界テストの構築

翻訳されたレポートは日常の臨床記述より均一になりがちなため、研究チームはRR-Findingsと呼ぶ新たな外部データセットも作成しました。この243件の日本語レポートは、9名の専門資格を持つ放射線科医が実際の肺がん症例で作成したものです。各レポートには同じ18項目の所見が、経験ある医師による慎重な二段階レビューでラベル付けされました。翻訳データセットとは異なり、これらのレポートは実際の放射線科医が使う多様な文体、言い換え、略語を含んでおり、モデルが自然言語の差異にどれだけ対応できるかをより厳しく試す試験となります。

より短い「語」断片から得られる速度向上

モデル間の主な違いは、処理前にテキストをどのように断片（トークン）に分割するかにあります。ModernBERTは日本語用語や混在する英語表現を効率よく扱うより豊富な語彙を使うため、同じレポートを表現するのに必要なトークン数が少なくて済みます。内部テストセットでは、ModernBERTは平均トークン数を従来型BERTより約4分の1削減しました。トークン数が少ないほど計算は速くなり、ModernBERTは訓練とテストの両方で毎秒処理するレポート数が約1.67倍で、学習完了までの時間も他モデルより大幅に短縮されました。重要なのは、この効率化が内部タスクでの性能低下を招かなかった点で、3モデルはいずれも同等の精度に到達し、厳密な「全ラベル正解」指標ではModernBERTが僅かに上回りました。

Figure 2. 新しいAIはレポートをより少ない断片に分解して高速に動作しますが、臨床現場で記述表現が変わると精度を落とすことがあります。

言語スタイルが変わると安定性が重要になる

実世界のRR-Findingsデータセットで試したところ、状況は変わりました。ここでは標準BERTが最も高い完全一致精度を示し、ModernBERTは翻訳レポートでの性能と比べて最大の低下を示しました。詳細解析では、ModernBERTは放射線科医が訓練時に見ていなかった表現を使った場合に苦戦する傾向があり、例えば瘢痕を直接的な用語ではなく「慢性炎症変化」と表現したり、特定の結節に対してGGNのような略語を用いた場合に弱さが目立ちました。しかしどの所見がより発生しやすいかという順位付け自体は概ね良好であり、基本的なパターン識別能力よりも、信頼度の閾値（しきい値）の調整が言語スタイルの変化に対して特に敏感であったことが示唆されます。

病院向けAIツールにとっての意味

放射線科レポートを社内でプライベートに処理したい病院にとって、ModernBERTは特に長文での速度と計算コストの面で明確な利点を提供します。データがよく一致していれば、従来モデルと同等かやや上回る精度で、より少ないリソースで動作できます。しかし本研究は効率性だけでは十分でないことも示しています：臨床の雑多な記述に対応するには多様な自然言語表現を含むデータで訓練し、モデルを調整することが必要です。著者らは、ModernBERTが日本語放射線科テキストに対する強力で効率的な選択肢である一方、書き方や患者層が変わっても高速モデルが信頼性を保てるよう、より多様な学習データと賢明なチューニングを今後の取り組みとして求めています。

引用: Yamagishi, Y., Kikuchi, T., Hanaoka, S. et al. ModernBERT is more efficient than conventional BERT for chest CT findings classification in Japanese radiology reports. Sci Rep 16, 15956 (2026). https://doi.org/10.1038/s41598-026-44292-z

キーワード: 放射線科レポート, 日本の医療AI, BERT, ModernBERT, 胸部CT所見