Clear Sky Science · pt
O registro de dados do INGV como uma infraestrutura curada de metadados para a gestão de dados das Ciências da Terra
Por que isso importa para quem se interessa por dados
Todos os dias, o instituto nacional italiano para terremotos e vulcões (INGV) registra enormes quantidades de informação sobre o comportamento do nosso planeta. Transformar esse fluxo de números em conhecimento que cientistas, gestores de emergência e o público possam realmente usar é surpreendentemente difícil. Este artigo explica como o INGV construiu uma espécie de catálogo mestre para seus dados — focado não em armazenar os arquivos em si, mas em descrevê-los de forma clara e consistente — para que observações valiosas sobre terremotos, vulcões, oceanos e meio ambiente sejam mais fáceis de encontrar, confiar e reutilizar.

De registros dispersos para um mapa único
O INGV é uma grande organização distribuída por muitos escritórios, laboratórios e observatórios em toda a Itália. Seus pesquisadores monitoram terremotos, vulcões em erupção, o fundo do mar, a atmosfera e muito mais, produzindo milhares de conjuntos de dados diferentes. No passado, esses dados estavam dispersos em sites de projetos, servidores institucionais e arquivos externos, tornando difícil até para o próprio INGV saber o que possuía. Para atender às crescentes expectativas por “Ciência Aberta” na Europa — onde os dados são compartilhados amplamente e precocemente — o instituto adotou uma abordagem “data-first”. Em vez de esperar pela publicação de artigos científicos, o INGV agora prioriza a liberação rápida dos dados e de suas descrições, com identificadores digitais estáveis para que possam ser citados e reutilizados de forma independente.
Um catálogo de descrições, não um disco rígido gigante
O coração desse esforço é o Registro de Dados do INGV, um catálogo curado que contém apenas metadados — as descrições padronizadas de cada conjunto de dados — em vez dos arquivos de dados propriamente ditos. Cada entrada no Registro aponta para onde os dados estão fisicamente hospedados, seja em servidores do INGV ou em plataformas externas como Zenodo ou repositórios especializados em ciências da Terra. Desde seu lançamento em 2019, o Registro cresceu de forma contínua para quase 800 registros, cobrindo a maior parte dos dados relacionados a terremotos, meio ambiente e vulcões do instituto. O catálogo usa formatos internacionais de descrição para que suas entradas possam ser lidas facilmente por outros sistemas na Europa e além. Cada registro recebe um código digital permanente (um DOI) e vincula o conjunto de dados às pessoas e instituições envolvidas por meio de IDs globais de pesquisadores e organizações.

Como qualidade e confiança são incorporadas
Para manter esse catálogo confiável, o INGV desenhou um processo de verificação em três etapas que combina testes automáticos com revisão humana. Quando um pesquisador cria uma nova entrada, uma ferramenta web interna verifica a ausência de itens essenciais, como identificadores de autores, cobertura temporal e espacial e informações de licenciamento. Só quando essas questões básicas são corrigidas o registro pode avançar. Em seguida, a equipe do Escritório de Gestão de Dados avalia a completude da entrada e confirma que a página vinculada ao DOI é acessível e está estruturada corretamente. Depois disso, gestores científicos locais e chefes de departamento nacional revisam o registro quanto à precisão e adequação estratégica antes de ele se tornar visível ao público. Esse desenho com “humano no circuito” visa manter os dados o mais abertos possível, ao mesmo tempo que protege informações sensíveis, respeita regras de privacidade e atende às novas expectativas de segurança em pesquisa.
Conectando-se ao mundo mais amplo da ciência
O Registro não é uma caixa fechada; ele fica no centro de uma teia mais ampla de serviços. Uma vez aprovados, os registros de metadados são automaticamente publicados no portal de dados abertos do INGV e disponibilizados por meio de várias interfaces de programação usadas por outras instituições. Infraestruturas de pesquisa europeias para ciências da Terra sólidas, sistemas de observação oceânica, portais nacionais e europeus de dados abertos e serviços globais de DOI podem todos colher essas descrições. Isso torna os conjuntos de dados do INGV visíveis dentro de um grafo mundial de objetos de pesquisa vinculados, onde dados, software, artigos, pessoas e organizações estão todos conectados. Ao mesmo tempo, o sistema ajuda os próprios gestores do INGV a acompanhar o que foi produzido, o que é especialmente importante durante crises como grandes terremotos ou erupções, quando muitas redes de monitoramento temporárias são implantadas e novos fluxos de dados surgem rapidamente.
Olhando adiante para uma descoberta mais inteligente
Embora o Registro já melhore a organização e o compartilhamento dos dados do INGV, os autores apontam vários desafios remanescentes. Alguns pesquisadores ainda fazem upload de dados em plataformas externas sem registrá-los, enfraquecendo a visão geral do instituto. O volume crescente de entradas pode ser avassalador para recém-chegados, que podem não saber quais conjuntos de dados são relevantes. Para enfrentar isso, o INGV planeja formas de navegação mais intuitivas e visuais pelo catálogo e a integração com novos repositórios institucionais. A equipe também está testando ferramentas automáticas que avaliam o quanto cada conjunto de dados segue os princípios “FAIR” — ser fácil de encontrar, acessar, combinar e reutilizar — e explorando como tornar as descrições mais claras para sistemas de inteligência artificial que cada vez mais ajudam os usuários a buscar informação.
O que isso significa para nossa compreensão da Terra
Para não especialistas, a mensagem principal é simples: quando os dados são cuidadosamente descritos, recebem identidades estáveis e são verificados quanto à qualidade, eles se tornam muito mais poderosos. O Registro de Dados do INGV transforma um mosaico de arquivos separados em uma paisagem coerente e navegável de informações sobre o comportamento da Terra. Isso facilita que cientistas de todo o mundo combinem dados italianos de terremotos e vulcões com outras fontes, reproduzam estudos anteriores e construam novos estudos mais rapidamente. A longo prazo, tais infraestruturas de metadados ajudam a transformar medições brutas em conhecimento compartilhado que pode melhorar a avaliação de riscos, apoiar a proteção civil e aprofundar nossa compreensão do planeta inquieto em que vivemos.
Citação: Locati, M., Mazza, S., Montalto, P. et al. The INGV data registry as a curated metadata infrastructure for Earth Science data stewardship. Sci Data 13, 607 (2026). https://doi.org/10.1038/s41597-026-06980-3
Palavras-chave: dados das ciências da Terra, catálogo de dados de pesquisa, ciência aberta, registro de metadados, princípios FAIR