Clear Sky Science · it
Il registro dati INGV come infrastruttura curata di metadata per la gestione dei dati delle Scienze della Terra
Perché è importante per chiunque sia curioso dei dati
Ogni giorno l’Istituto Nazionale di Geofisica e Vulcanologia (INGV) registra enormi quantità di informazioni su come si comporta il nostro pianeta. Trasformare questo flusso di numeri in conoscenza che scienziati, gestori delle emergenze e pubblico possano davvero usare è sorprendentemente difficile. Questo articolo spiega come l’INGV abbia costruito una sorta di catalogo principale per i suoi dati—concentrato non sulla conservazione dei file in sé, ma sulla loro descrizione chiara e coerente—così che osservazioni preziose su terremoti, vulcani, oceani e ambiente siano più facili da trovare, verificare e riutilizzare.

Da archivi sparsi a una mappa unica
L’INGV è una grande organizzazione diffusa in molti uffici, laboratori e osservatori in tutta Italia. I suoi ricercatori monitorano terremoti, vulcani in eruzione, il fondale marino, l’atmosfera e molto altro, producendo migliaia di dataset diversi. In passato questi erano sparsi su siti di progetto, server istituzionali e archivi esterni, rendendo difficile persino per l’INGV sapere cosa effettivamente possedeva. Per rispondere alle crescenti aspettative per la “Scienza Aperta” in Europa—dove i dati vengono condivisi ampiamente e precocemente—l’istituto ha adottato un approccio “data-first”. Invece di aspettare la pubblicazione degli articoli scientifici, l’INGV dà ora priorità al rilascio rapido dei dati e delle loro descrizioni, completi di identificatori digitali stabili affinché possano essere citati e riutilizzati autonomamente.
Un catalogo di descrizioni, non un disco rigido gigante
Al cuore di questo sforzo c’è il Registro Dati INGV, un catalogo curato che contiene solo metadata—le descrizioni standardizzate di ciascun dataset—piuttosto che i file di dati in sé. Ogni voce del Registro punta a dove i dati risiedono fisicamente, sia sui server dell’INGV sia su piattaforme esterne come Zenodo o archivi specializzati nelle scienze della Terra. Dal suo lancio nel 2019, il Registro è cresciuto costantemente fino a quasi 800 record, coprendo la maggior parte dei dati dell’istituto relativi a terremoti, ambiente e vulcanologia. Il catalogo utilizza formati di descrizione internazionali in modo che le sue voci possano essere facilmente lette da altri sistemi in Europa e oltre. Ogni record riceve un codice digitale permanente (un DOI) e collega il dataset alle persone e alle istituzioni coinvolte tramite identificatori globali di ricercatori e organizzazioni.

Come vengono assicurate qualità e fiducia
Per mantenere il catalogo affidabile, l’INGV ha progettato un processo di controllo in tre fasi che combina test automatici e revisione umana. Quando un ricercatore crea una nuova voce, uno strumento web interno verifica la presenza di elementi essenziali mancanti come gli identificatori degli autori, la copertura temporale e spaziale e le informazioni sulla licenza. Solo quando queste questioni di base vengono risolte il record può procedere. Successivamente, il personale dell’Ufficio Gestione Dati verifica la completezza dell’entry e conferma che la pagina web a cui punta il DOI sia accessibile e strutturata correttamente. Dopo di che, i responsabili scientifici locali e i capi dipartimento nazionali revisionano il record per accuratezza e coerenza strategica prima che diventi visibile al pubblico. Questo design con “umano nel ciclo” mira a mantenere i dati il più aperti possibile proteggendo al contempo le informazioni sensibili, rispettando le norme sulla privacy e rispondendo alle nuove aspettative di sicurezza della ricerca.
Connessione con il più ampio mondo della scienza
Il Registro non è una scatola chiusa; siede al centro di una rete più ampia di servizi. Una volta approvato, ogni record di metadata viene pubblicato automaticamente sul portale open data dell’INGV e reso disponibile attraverso diverse interfacce di programmazione usate da altre istituzioni. Infrastrutture di ricerca europee per le scienze della Terra solide, sistemi di osservazione oceanica, portali nazionali ed europei di open data e servizi DOI globali possono tutti raccogliere queste descrizioni. Ciò rende i dataset dell’INGV visibili all’interno di un grafo mondiale di oggetti di ricerca collegati, dove dati, software, articoli, persone e organizzazioni sono connessi tra loro. Allo stesso tempo, il sistema aiuta i manager dell’INGV a tenere traccia di quanto è stato prodotto, cosa particolarmente importante durante le crisi come grandi terremoti o eruzioni, quando vengono dispiegate molte reti di monitoraggio temporanee e compaiono rapidamente nuovi flussi di dati.
Sguardo al futuro per una scoperta più intelligente
Benché il Registro migliori già l’organizzazione e la condivisione dei dati dell’INGV, gli autori evidenziano diverse sfide ancora aperte. Alcuni ricercatori caricano ancora dati su piattaforme esterne senza registrarli, indebolendo la visione d’insieme dell’istituto. Il crescente volume di record può risultare travolgente per i nuovi utenti, che potrebbero non sapere quali dataset siano rilevanti. Per questo l’INGV sta pianificando modi di navigazione del catalogo più intuitivi e visivi e l’integrazione con nuovi repository istituzionali. Il team sta inoltre testando strumenti automatizzati che valutano quanto ogni dataset rispetti i principi “FAIR”—essere facilmente trovabile, accessibile, combinabile e riutilizzabile—e sta esplorando come rendere le descrizioni più comprensibili per i sistemi di intelligenza artificiale che sempre più aiutano gli utenti a cercare informazioni.
Cosa significa per la nostra comprensione della Terra
Per i non specialisti, il messaggio chiave è semplice: quando i dati sono descritti con cura, dotati di identità stabili e sottoposti a controlli di qualità, diventano molto più potenti. Il Registro Dati dell’INGV trasforma un mosaico di archivi separati in un paesaggio coerente e navigabile di informazioni sul comportamento della Terra. Questo facilita per gli scienziati di tutto il mondo la combinazione dei dati italiani su terremoti e vulcani con altre fonti, la riproduzione di studi passati e la realizzazione di nuovi studi più rapidamente. A lungo termine, tali infrastrutture di metadata aiutano a trasformare misurazioni grezze in conoscenza condivisa che può migliorare la valutazione dei rischi, supportare la protezione civile e approfondire la nostra comprensione del pianeta irrequieto su cui viviamo.
Citazione: Locati, M., Mazza, S., Montalto, P. et al. The INGV data registry as a curated metadata infrastructure for Earth Science data stewardship. Sci Data 13, 607 (2026). https://doi.org/10.1038/s41597-026-06980-3
Parole chiave: dati delle scienze della Terra, catalogo dei dati di ricerca, scienza aperta, registro dei metadata, principi FAIR