Clear Sky Science · ja
地球科学データ管理のためのキュレーションされたメタデータ基盤としてのINGVデータレジストリ
データに興味がある人にとっての重要性
イタリアの地震・火山を監視する国立研究所(INGV)は、日々、地球の振る舞いに関する膨大な情報を記録しています。この数値の洪水を、科学者、緊急管理者、一般市民が実際に利用できる知識に変えるのは意外に難しいことです。本稿は、INGVがどのようにしてデータのマスターカタログのような仕組みを構築したかを説明します。ここではファイル自体を格納するのではなく、それらを明確かつ一貫して記述することに重点を置き、地震、火山、海洋、環境に関する貴重な観測が見つけやすく、信頼でき、再利用しやすくなるようにしています。

散在する記録から一つの地図へ
INGVはイタリア全国に広がる多くの事務所、研究所、観測所を抱える大規模な組織です。研究者たちは地震、噴火中の火山、海底、大気などを監視し、数千におよぶ異なるデータセットを生み出します。以前はこれらがプロジェクトのウェブサイト、機関のサーバー、外部アーカイブなどに散在しており、INGV自身でさえ何を保有しているのか把握しづらい状況でした。ヨーロッパで求められる「オープンサイエンス」──データを早期かつ広く共有すること──への期待に応えるため、同研究所は「データ優先」のアプローチを採用しました。論文の公開を待つのではなく、データとその記述を迅速に公開し、恒久的なデジタル識別子を付与してそれ自体を引用・再利用できるようにしています。
巨大なハードドライブではなく記述のカタログ
この取り組みの中核にあるのがINGVデータレジストリで、ここはデータファイル自体ではなく、各データセットの標準化された記述であるメタデータだけを保持するキュレーションされたカタログです。レジストリの各エントリは、データが実際に保管されている場所(INGVのサーバーやZenodoなどの外部プラットフォーム、専門の地球科学リポジトリ)への参照を示します。2019年の開始以来、レジストリは着実に成長し、ほぼ800件の記録を数え、同研究所の地震・環境・火山に関するデータの大部分をカバーしています。カタログは国際的な記述フォーマットを採用しており、ヨーロッパ内外の他システムが読み取りやすくしています。すべての記録には恒久的なデジタルコード(DOI)が付与され、データセットは国際的な研究者IDや組織IDを通じて関係者や機関と結び付けられます。

信頼と品質を組み込む仕組み
このカタログを信頼できるものに保つために、INGVは自動テストと人的レビューを組み合わせた三段階のチェックプロセスを設計しました。研究者が新しいエントリを作成すると、内部のウェブツールが著者識別子、時間と場所の範囲、ライセンス情報のような必須項目の欠落を確認します。これらの基本的な問題が修正されて初めて記録は次の段階へ進めます。次にデータ管理室のスタッフがエントリの充実度を確認し、DOIが指すウェブページがアクセス可能で適切に構成されていることを確認します。その後、現地の科学管理者や全国部門の責任者が記録の正確性と戦略的適合性を検査し、公開可能となります。この「人を介した」設計は、可能な限りデータを開く一方で、機微な情報の保護、プライバシー規則の尊重、研究セキュリティに対する新たな期待に応えることを目指しています。
より広い科学の世界との接続
レジストリは閉じた箱ではなく、より広範なサービス群の中心に位置しています。承認されると、各メタデータ記録は自動的にINGVのオープンデータポータルに公開され、他の機関が使用するいくつかのプログラミングインターフェースを通じて利用可能になります。固体地球科学の欧州研究基盤、海洋観測システム、国内外のオープンデータポータル、世界的なDOIサービスはこれらの記述を収集できます。これにより、INGVのデータセットはデータ、ソフトウェア、論文、人、組織が結び付く世界的なリンクされた研究オブジェクトのグラフの中で可視化されます。同時に、このシステムはINGV自身の管理者が何が生成されたかを把握するのにも役立ちます。特に大規模な地震や噴火のような危機時には、多数の臨時観測ネットワークが展開され新たなデータストリームが急速に生じるため、これは重要です。
より賢い検索に向けて
レジストリはすでにINGVのデータの整理と共有を改善していますが、著者らは依然として残る課題を指摘しています。研究者の一部はデータを登録せずに外部プラットフォームにアップロードしており、機関全体の把握が弱まっています。エントリ数の増加は新規利用者にとって圧倒的で、どのデータセットが関連性があるか分かりにくいこともあります。これに対処するため、INGVはカタログをより直感的で視覚的に閲覧できる方法や、新たな機関リポジトリとの統合を計画しています。チームは各データセットが「FAIR」原則(見つけやすさ、アクセスの容易さ、結合しやすさ、再利用のしやすさ)にどの程度従っているかを自動的に評価するツールの試験も行っており、検索支援にますますAIを活用する状況に対応して記述をAIにとって分かりやすくする方法も模索しています。
地球理解への意味
非専門家にとっての主なメッセージは明快です。データが丁寧に記述され、安定した識別が与えられ、品質がチェックされると、そのデータははるかに強力になります。INGVのデータレジストリは、分散したアーカイブの継ぎ接ぎを地球の振る舞いに関する情報の一貫した、ナビゲート可能な景観へと変えます。これにより世界中の科学者がイタリアの地震・火山データを他の情報源と組み合わせ、過去の研究を再現し、新たな研究をより迅速に構築しやすくなります。長期的には、このようなメタデータ基盤が生の計測を共有知へと変換し、危険評価の改善、民間防護の支援、そして私たちが住む常に動き続ける惑星への理解を深めるのに寄与します。
引用: Locati, M., Mazza, S., Montalto, P. et al. The INGV data registry as a curated metadata infrastructure for Earth Science data stewardship. Sci Data 13, 607 (2026). https://doi.org/10.1038/s41597-026-06980-3
キーワード: 地球科学データ, 研究データカタログ, オープンサイエンス, メタデータ登録, FAIR原則