Clear Sky Science · ja
ヘモグロビン障害研究センターにおけるFAIRデータのギャップと協力意欲
より良いデータが人生を変える理由
鎌状赤血球症や地中海性貧血(サラセミア)などの重篤な血液疾患は世界中で何百万人もの人に影響を及ぼし、多くは生涯にわたる合併症を伴います。臨床医や研究者は、簡単な血液検査から複雑な遺伝学的解析に至るまで、多くの情報をすでに収集しています。しかし、こうした情報の多くは孤立したファイルや病院のシステム内にあり、容易に相互通信できる状態にはなっていません。本稿は、ヘモグロビン異常に関する研究センターが現在どのようにデータを管理しているか、最大のギャップはどこにあるか、患者情報をより効果的に活用して新たな発見やより良い医療につなげるためにどの程度協力する準備があるかを把握するための国際的な取り組みについて紹介します。
このデータ健診に参加したのは誰か
この調査は、遺伝性血液疾患に焦点を当てた欧州主導のネットワークHELIOSに所属する22か国の44チームを対象に行われました。参加者は医師、研究室の科学者、データ専門家、患者擁護者など、多様な関係者を含んでおり、これらの病態の管理に関わる多くの立場を反映しています。センターは西欧の資源の豊富な病院から、研究資源が限られた東欧、アフリカ、アジアの診療所や研究所まで幅があり、合わせて世界で最も一般的な遺伝性血液疾患である鎌状赤血球症およびα・βサラセミアの患者を診療しています。

これらのセンターが実際に保有するデータ
調査結果は、多くのセンターがこれらの疾患を理解するために必要な基本情報をすでに収集していることを示しています。ほとんどの施設が患者の年齢や性別、日常的な検査値、そして血液異常を引き起こす主要な遺伝子変異に関する情報を持っていました。しかし、より詳細な情報は得にくいのが現状です。症状、病院での処置、画像検査などをコンピュータが検索しやすい構造化された記録として保持しているセンターは少数でした。最も希少なのは、全ゲノムシーケンスやその他の“オミクス”データ、機器由来の計測などの高度なデータで、これらは資金の潤沢な研究環境でのみ利用可能な傾向がありました。資源の乏しい国のセンターではこうした豊富なデータが欠けていることが特に多く、最先端の研究に参加するのが難しくなっています。
データの保存と共有の状況
調査はまた、各センターが情報をどのように保存しているか、複数拠点で結合する準備ができているかも検討しました。回答者のほぼ半数が研究データをローカルなデータベースに保持しており、スプレッドシートや一般的な研究プラットフォームであるREDCapのような馴染みのあるツールがよく使われていました。国際的な標準規格を用いて機関間でデータを簡単に連携できるようにしている例は非常に少数でした。症状や診断のために広く受け入れられている医療コーディングシステムを使用しているセンターは5分の1にすぎず、大規模な医療研究で標準になりつつある「コモンデータモデル」を使っているところは皆無でした。データの保持期間に関する正式な規則や個人識別情報を除去する標準化された方法といった実務的な安全対策も稀であり、多くのスタッフが自機関の実務内容を把握していませんでした。

協力への意欲
こうした技術面のギャップにもかかわらず、協力の人的側面ははるかに有望に見えます。ほとんどのチームがすでに自らのデータを用いて発表または継続中の研究を行っており、圧倒的多数の95%が多施設共同研究への参加に関心を示しました。注目すべきことに86%が「フェデレーテッド(分散型)」プロジェクトに参加する意向を示しており、データをローカルサーバーにとどめ、集計結果のみを共有するこの手法はプライバシー保護や法的懸念の緩和に役立ちます。研究にデータをまだ活用したことのないセンターの中にも参加準備が整っているところがあり、適切な支援があれば将来のプロジェクトに取り込める未活用の情報資源が存在することを示唆しています。
次に変えるべきこと
研究者らが現行の慣行を“FAIR”データ(Findable=発見可能、Accessible=アクセス可能、Interoperable=相互運用可能、Reusable=再利用可能)の理想と比較したところ、評価は一様ではありませんでした。センターの約半数にはデータセットを説明する基本的なドキュメントが少なくとも存在し、過半数が適切な承認の下で自らのデータがすでに研究に使われたと報告しました。しかし、データセットを公開リポジトリに置いているセンターはほとんどなく、異なる拠点のデータを容易に統合するための共通の技術標準を使っている例もほとんどありませんでした。著者らは、インフラ、研修、および簡便なガバナンスツールキットへの重点的な投資が、特に資源の限られた地域のセンターを共通フォーマットとより安全で一貫したデータ管理へと導くのに有効だと主張しています。
なぜ患者にとって重要なのか
鎌状赤血球症やサラセミアを抱える人々にとって、データ標準の詳細は抽象的に聞こえるかもしれませんが、それは非常に現実的な影響をもたらします。何千人もの患者に関する情報を結合して比較できれば、研究者はどの治療が最も効果的か、どの合併症に注意すべきか、遺伝子治療などの新しい治療法が長期的にどのように機能するかをより正確に見極められます。この調査は、多くのヘモグロビン異常のセンターが依然として断片化され不一致なデータシステムに依存している一方で、特にデータを現地に留めることでプライバシーを守るネットワークを通じた協力に強い意欲があることを示しています。その意欲を整理され接続されたデータに変えることができれば、発見は加速し、居住地に関わらず患者が最良の根拠に基づく利益を享受できる可能性が高まります。
引用: Tamana, S., Yiangou, K., Orphanou, K. et al. FAIR data gaps and collaboration willingness among hemoglobinopathy research centers. Sci Data 13, 582 (2026). https://doi.org/10.1038/s41597-026-06950-9
キーワード: ヘモグロビン病, 希少疾患データ, FAIRデータ, フェデレーテッド研究, データ相互運用性