Clear Sky Science · ja
170万人のデータで事前学習したマルチモーダル基盤モデルを用いた、シナリオと機器を横断する心臓健康評価
なぜ心拍データが重要なのか
病院の心電モニターからスマートウォッチに至るまで、私たちの生活は心臓からの微細な電気的・光学的信号によってますます記録されるようになっています。これらの記録は危険な不整脈を検出したり、カフを使わずに血圧を推定したり、将来の心疾患リスクを示唆したりできます。しかし、機器や利用環境が多様なため、現在のアルゴリズムはしばしば作られた限られた条件でしかうまく機能しません。本研究は、複数の機器、国、ユースケースにまたがって心臓の健康を理解しようとする新しいタイプの「基盤」モデルを紹介します。

心臓を聴く多様な方法
医師や機器は心臓をいくつかの方法で観察します。古典的な病院検査は12誘導心電図(ECG)で、胸部や四肢に電極を貼って心臓の電気活動を多角的に記録します。集中治療室ではしばしば誘導数が少なく、皮膚に光を当て血液の拍動を追う光電式容積脈波(PPG)と組み合わせて使われます。家庭では、スマートウォッチやパッチが単一のECGチャネルまたはPPGだけを記録することがあります。これらの設定はそれぞれ信号の形状、長さ、チャネル数が異なり、一つのモデルですべてに対応することを難しくしてきました。従来の手法は通常、機器やタスクごとに別個の専用アルゴリズムを学習させ、異なる環境や集団へ移すと性能が低下しがちです。
多様な心信号に対応する単一の“脳”
研究者たちは、これらすべての信号に共通の“脳”として機能する心臓センシング基盤モデル(CSFM)を設計しました。1つの整ったデータセットから学習する代わりに、CSFMは大規模で混在したコレクション、約170万件の心臓記録(複数の病院・国からのECGおよびPPG波形と、それらについて医師や機械が作成したテキスト報告を含む)で事前学習されました。モデルは信号を短いセグメントに分割し、信号とテキストの両方をトークン化してトランスフォーマーに入力します。トランスフォーマーは言語や画像理解で近年の進展を支えた深層学習アーキテクチャです。学習中には多くのトークンが意図的に隠され、モデルは欠損部分を再構築することを学びます。この「マスク」学習は、異なる機器や誘導、記述言語に共通する重要なパターンをCSFMが捉えるよう促します。
診断から血圧推定まで
一度学習されたCSFMは、比較的小さなラベル付きデータセットを用いて多様な具体的タスクに適応できます。研究チームは標準的な12誘導ECG、ウェアラブルの単一誘導ECG、スマートウォッチ由来のPPGを用いた心律および疾患分類で評価しました。CSFMは単に既存の強力なタスク特化型ディープネットワークに匹敵するだけでなく、しばしばそれらを上回りました。CSFMはまた、短時間のECGやPPGから年齢、性別、体格指数(BMI)を推定する助けにもなり、心拍以外の被検者に関する微妙な手がかりも取り込んでいることを示しました。別の実験群では、モデルはECGとPPGから連続的な血圧波形を生成し、さらにそれを収縮期・拡張期の値に変換して、競合手法よりも精度の高いカフレス血圧推定を行いました。

機器を横断し、欠落情報を埋める
特に重要な検証は、通常の情報の一部しか得られない状況をCSFMが扱えるかどうかでした。研究者たちはCSFMから微調整したモデルが、12誘導、6誘導、2誘導、あるいは単一誘導というような異なる入力でいずれの場合もうまく機能することを示しました。ECGのみ、PPGのみ、ECGとPPGの組み合わせといった入力構成も評価しましたが、これらの設定全体においてCSFMベースのシステムは堅調に性能を保ち、従来モデルはより急速に劣化しました。モデルの内部表現は、勾配ブースティング木のような単純なツールのための既製の特徴としても利用でき、完全に微調整した深層ネットワークと同等の性能に到達することがよくありました。最後に回帰ヘッドを付加することで、CSFMはある種の信号を別の信号に変換できました。例えば、PPGから現実的なECGを生成したり、単一誘導から完全な12誘導ECGを再構成したりでき、理想的な記録が得られない場合のデータ拡張や解析改善への道を開きます。
患者にとっての意義
非専門家に向けた核心的なメッセージは、単一の汎用モデルが非常に異なる心臓記録を理解し、正確で臨床的に有用な回答を提供できるようになった、という点です。機器や病院ごとに壊れやすいアルゴリズムを個別に作る代わりに、CSFMは危険なリズムをスマートウォッチで検出することから、1年以内の死亡リスクが高い患者を予測することまで、地域のニーズに応じて軽く適応させられる共有の基盤を提供します。著者らは、モデルの決定を臨床医が解釈しやすくすることや計算負荷の削減など、未解決の課題を認めています。それでも、心信号の基盤モデルは、高度な心臓モニタリングやリスク予測をより多くの人々、より多くの場所で、既に使っている機器を通じて提供する助けになる可能性を示唆しています。
引用: Gu, X., Tang, W., Han, J. et al. Cardiac health assessment across scenarios and devices using a multimodal foundation model pretrained on data from 1.7 million individuals. Nat Mach Intell 8, 220–233 (2026). https://doi.org/10.1038/s42256-026-01180-5
キーワード: 心臓基盤モデル, 心電図, 光電式容積脈波記録(PPG), デジタル循環器学, ウェアラブル心臓モニタリング