Clear Sky Science · sv

INGV:s dataregister som en kurerad metadata-infrastruktur för förvaltning av geovetenskapliga data

· Tillbaka till index

Varför det här är viktigt för alla som undrar över data

Varje dag registrerar Italiens nationella institut för jordbävningar och vulkaner (INGV) enorma mängder information om hur vår planet beter sig. Att omvandla denna flod av siffror till kunskap som forskare, räddningscheförer och allmänheten faktiskt kan använda är överraskande svårt. Den här artikeln förklarar hur INGV byggde en slags huvudkatalog för sina data — inriktad inte på att lagra filerna själva, utan på att beskriva dem tydligt och konsekvent — så att värdefulla observationer om jordbävningar, vulkaner, hav och miljö blir lättare att hitta, lita på och återanvända.

Figure 1
Figure 1.

Från spridda register till en enda karta

INGV är en stor organisation spridd över många kontor, laboratorier och observatorier i hela Italien. Dess forskare övervakar jordbävningar, utbrottande vulkaner, havsbotten, atmosfären och mycket mer och producerar tusentals olika datamängder. Tidigare var dessa utspridda på projektwebbplatser, institutionsservrar och externa arkiv, vilket gjorde det svårt även för INGV självt att veta vad som fanns. För att möta växande förväntningar på "Öppen vetenskap" i Europa — där data delas brett och tidigt — antog institutet en "data-first"-strategi. Istället för att vänta på att vetenskapliga artiklar publiceras prioriterar INGV nu att snabbt släppa data och deras beskrivningar, komplett med stabila digitala identifierare så att de kan citeras och återanvändas på egen hand.

En katalog av beskrivningar, inte en jättehårddisk

Kärnan i detta arbete är INGV Data Registry, en kurerad katalog som endast innehåller metadata — de standardiserade beskrivningarna av varje datamängd — snarare än datafilerna själva. Varje post i registret pekar på var data fysiskt finns, vare sig på INGV:s servrar eller på externa plattformar som Zenodo eller specialiserade arkiv för geovetenskap. Sedan starten 2019 har registret vuxit stadigt till nästan 800 poster och täcker större delen av institutets data om jordbävningar, miljö och vulkaner. Katalogen använder internationella beskrivningsformat så att dess poster lätt kan läsas av andra system i Europa och bortom. Varje post får en permanent digital kod (en DOI) och kopplar datamängden till de personer och institutioner som är inblandade via globala forskar- och organisations-ID:n.

Figure 2
Figure 2.

Hur kvalitet och förtroende byggs in

För att hålla denna katalog tillförlitlig har INGV utformat en trestegs granskningsprocess som kombinerar automatiska tester med mänsklig granskning. När en forskare skapar en ny post kontrollerar ett internt webbverktyg efter saknade grundläggande uppgifter såsom författaridentifierare, tids- och platsomfattning och licensinformation. Först när dessa grundläggande frågor är åtgärdade kan posten gå vidare. Därefter granskar personal på Data Management Office postens fullständighet och bekräftar att webbsidan dit DOIn leder är åtkomlig och korrekt strukturerad. Därefter granskar lokala vetenskapliga chefer och nationella avdelningsansvariga posten vad gäller noggrannhet och strategisk lämplighet innan den blir synlig för allmänheten. Denna "människa i loopen"-utformning syftar till att hålla data så öppna som möjligt samtidigt som känslig information skyddas, integritetsregler respekteras och nya förväntningar på forskningssäkerhet uppfylls.

Anslutning till vetenskapens bredare värld

Registret är inte en sluten låda; det sitter i centrum för ett större nätverk av tjänster. När en metadata-post godkänts publiceras den automatiskt på INGV:s öppna dataportal och görs tillgänglig via flera programmeringsgränssnitt som används av andra institutioner. Europeiska forskningsinfrastrukturer för fast jord, marina observationssystem, nationella och europeiska öppna dataportalser samt globala DOI-tjänster kan alla hämta dessa beskrivningar. Det gör INGV:s datamängder synliga inom en världsomspännande graf av länkade forskningsobjekt, där data, mjukvara, artiklar, människor och organisationer är sammanlänkade. Samtidigt hjälper systemet INGV:s egna chefer att hålla koll på vad som producerats, vilket är särskilt viktigt under kriser som stora jordbävningar eller utbrott, när många tillfälliga övervakningsnätverk sätts upp och nya datakanaler dyker upp snabbt.

Framtiden: smartare upptäckt

Trots att registret redan förbättrar hur INGV:s data organiseras och delas, noterar författarna flera kvarstående utmaningar. Vissa forskare laddar fortfarande upp data till externa plattformar utan att registrera dem, vilket försvagar institutets överblick. Det växande antalet poster kan vara överväldigande för nykomlingar som kanske inte vet vilka datamängder som är relevanta. För att möta detta planerar INGV mer intuitiva, visuella sätt att bläddra i katalogen och att integrera den med nya institutionella arkiv. Teamet testar också automatiserade verktyg som poängsätter hur väl varje datamängd följer "FAIR"-principerna — att vara lätt att hitta, komma åt, kombinera och återanvända — och utforskar hur beskrivningarna kan göras tydligare för artificiella intelligenssystem som i allt större utsträckning hjälper användare att söka information.

Vad detta betyder för vår förståelse av jorden

För icke-specialister är huvudbudskapet enkelt: när data beskrivs noggrant, ges stabila identiteter och kontrolleras för kvalitet blir de mycket mer kraftfulla. INGV:s dataregister förvandlar ett lapptäcke av separata arkiv till ett sammanhängande, navigerbart informationslandskap om hur jorden beter sig. Det gör det enklare för forskare världen över att kombinera italienska jordbävnings- och vulkandata med andra källor, reproducera tidigare studier och bygga nya snabbare. På lång sikt hjälper sådana metadatainfrastrukturer till att förvandla råa mätningar till delad kunskap som kan förbättra riskbedömningar, stödja civilskyddet och fördjupa vår förståelse av den rastlösa planet vi lever på.

Citering: Locati, M., Mazza, S., Montalto, P. et al. The INGV data registry as a curated metadata infrastructure for Earth Science data stewardship. Sci Data 13, 607 (2026). https://doi.org/10.1038/s41597-026-06980-3

Nyckelord: geovetenskapliga data, forskningsdatakatalog, öppen vetenskap, metadataregister, FAIR-principerna