Clear Sky Science · es
El registro de datos del INGV como infraestructura curada de metadatos para la custodia de datos en Ciencias de la Tierra
Por qué esto importa para quien tenga curiosidad sobre los datos
Cada día, el instituto nacional de terremotos y volcanes de Italia (INGV) registra enormes cantidades de información sobre cómo se comporta nuestro planeta. Transformar ese aluvión de números en conocimiento que científicos, gestores de emergencias y el público puedan usar resulta sorprendentemente difícil. Este artículo explica cómo el INGV construyó una especie de catálogo maestro para sus datos —centrado no en almacenar los archivos en sí, sino en describirlos de forma clara y coherente— para que las observaciones valiosas sobre terremotos, volcanes, océanos y medio ambiente sean más fáciles de encontrar, confiar y reutilizar.

De registros dispersos a un único mapa
El INGV es una organización grande distribuida en muchas oficinas, laboratorios y observatorios por toda Italia. Sus investigadores monitorizan terremotos, volcanes en erupción, el lecho marino, la atmósfera y mucho más, produciendo miles de conjuntos de datos distintos. En el pasado, estos estaban dispersos en sitios web de proyectos, servidores institucionales y archivos externos, lo que dificultaba incluso al propio INGV saber qué tenía. Para responder a las crecientes expectativas de “Ciencia Abierta” en Europa —donde los datos se comparten de forma amplia y temprana— el instituto adoptó un enfoque “data-first”. En lugar de esperar a que se publiquen los artículos científicos, el INGV ahora prioriza la liberación rápida de los datos y sus descripciones, con identificadores digitales estables para que puedan citarse y reutilizarse por sí mismos.
Un catálogo de descripciones, no un disco duro gigante
El núcleo de este esfuerzo es el Registro de Datos del INGV, un catálogo curado que contiene solo metadatos —las descripciones estandarizadas de cada conjunto de datos— en lugar de los archivos de datos. Cada entrada en el Registro señala dónde residen físicamente los datos, ya sea en servidores del INGV o en plataformas externas como Zenodo o repositorios especializados en ciencias de la Tierra. Desde su lanzamiento en 2019, el Registro ha crecido de forma constante hasta casi 800 registros, cubriendo la mayor parte de los datos del instituto relacionados con terremotos, medio ambiente y volcanes. El catálogo utiliza formatos internacionales de descripción para que sus entradas puedan ser leídas fácilmente por otros sistemas en Europa y más allá. Cada registro recibe un código digital permanente (un DOI) y vincula el conjunto de datos con las personas e instituciones implicadas mediante identificadores globales de investigadores y organizaciones.

Cómo se incorporan la calidad y la confianza
Para mantener este catálogo fiable, el INGV diseñó un proceso de verificación en tres pasos que combina pruebas automáticas con revisión humana. Cuando un investigador crea una nueva entrada, una herramienta web interna comprueba si faltan elementos esenciales como identificadores de autores, cobertura temporal y espacial, e información sobre licencias. Solo cuando se corrigen estos aspectos básicos puede avanzar el registro. A continuación, el personal de la Oficina de Gestión de Datos revisa la integridad de la entrada y confirma que la página web a la que conduce el DOI es accesible y está correctamente estructurada. Después de eso, los responsables científicos locales y los jefes de departamento nacionales revisan el registro para comprobar su exactitud y su ajuste estratégico antes de que se haga público. Este diseño con “humano en el bucle” pretende mantener los datos tan abiertos como sea posible, a la vez que protege la información sensible, respeta las normas de privacidad y cumple las nuevas expectativas en materia de seguridad de la investigación.
Conexión con el mundo científico más amplio
El Registro no es una caja cerrada; se sitúa en el centro de una red más amplia de servicios. Una vez aprobada, cada entrada de metadatos se publica automáticamente en el portal de datos abiertos del INGV y se pone a disposición a través de varias interfaces de programación usadas por otras instituciones. Infraestructuras europeas de investigación para las ciencias de la Tierra sólida, sistemas de observación oceánica, portales nacionales y europeos de datos abiertos y servicios DOI globales pueden cosechar estas descripciones. Esto hace que los conjuntos de datos del INGV sean visibles dentro de un grafo mundial de objetos de investigación enlazados, donde datos, software, artículos, personas y organizaciones están todos conectados. Al mismo tiempo, el sistema ayuda a los propios gestores del INGV a hacer seguimiento de lo producido, algo especialmente importante durante crisis como grandes terremotos o erupciones, cuando se despliegan muchas redes de monitorización temporales y aparecen nuevos flujos de datos con rapidez.
Mirando hacia un descubrimiento más inteligente
Aunque el Registro ya mejora la forma en que los datos del INGV se organizan y comparten, los autores señalan varios desafíos pendientes. Algunos investigadores todavía suben datos a plataformas externas sin registrarlos, debilitando la visión general del instituto. El creciente volumen de entradas puede resultar abrumador para los recién llegados, que quizá no sepan qué conjuntos de datos son relevantes. Para abordar esto, el INGV está planificando formas de navegación más intuitivas y visuales del catálogo e integrarlo con nuevos repositorios institucionales. El equipo también está probando herramientas automatizadas que puntúan hasta qué punto cada conjunto de datos sigue los principios “FAIR” —ser fáciles de encontrar, acceder, combinar y reutilizar— y explorando cómo hacer las descripciones más comprensibles para los sistemas de inteligencia artificial que cada vez más ayudan a los usuarios a buscar información.
Qué significa esto para nuestra comprensión de la Tierra
Para los no especialistas, el mensaje clave es sencillo: cuando los datos se describen con cuidado, se les asignan identidades estables y se verifican por su calidad, se vuelven mucho más poderosos. El Registro de Datos del INGV convierte un mosaico de archivos separados en un panorama coherente y navegable de información sobre el comportamiento de la Tierra. Esto facilita que científicos de todo el mundo combinen los datos italianos sobre terremotos y volcanes con otras fuentes, reproduzcan estudios anteriores y construyan otros nuevos con mayor rapidez. A largo plazo, estas infraestructuras de metadatos ayudan a transformar mediciones brutas en conocimiento compartido que puede mejorar la evaluación de riesgos, apoyar la protección civil y profundizar nuestra comprensión del planeta inquieto en el que vivimos.
Cita: Locati, M., Mazza, S., Montalto, P. et al. The INGV data registry as a curated metadata infrastructure for Earth Science data stewardship. Sci Data 13, 607 (2026). https://doi.org/10.1038/s41597-026-06980-3
Palabras clave: datos de ciencias de la Tierra, catálogo de datos de investigación, ciencia abierta</keyword+c> <keyword>registro de metadatos, principios FAIR