Clear Sky Science · es

Inteligencia artificial explicable para la segmentación de facies sedimentarias

· Volver al índice

Leer la historia de la Tierra a partir de cilindros de roca

Para entender cómo evolucionaron ríos, deltas y costas —y cuánto de estable es realmente el suelo bajo nuestras ciudades— los geólogos estudian largos cilindros de sedimento extraídos del subsuelo. Interpretar estos testigos es un trabajo lento y especializado. Este estudio muestra cómo la inteligencia artificial (IA), combinada con herramientas que revelan su razonamiento interno, puede ayudar a automatizar esa tarea sin dejar de permitir a los científicos ver por qué el ordenador llegó a una determinada conclusión.

Figure 1
Figure 1.

Por qué importan los testigos sedimentarios

Los sedimentos del subsuelo registran inundaciones pasadas, cambios del nivel del mar, terremotos y variaciones climáticas. Los especialistas dividen cada testigo en “facies”, capas que reflejan ambientes distintos como canales fluviales, llanuras de inundación bien o mal drenadas, pantanos costeros o fangos marinos. Estas distinciones guían desde reconstrucciones paleoclimáticas hasta evaluaciones de riesgo sísmico y estabilidad del terreno. Pero el mapeo cuidadoso de facies exige años de formación en sedimentología, y aun los expertos se enfrentan a ambigüedades cuando las capas son parecidas o los testigos están dañados. Hacer este trabajo más accesible y consistente es una motivación clave para aplicar IA.

Enseñar a una red neuronal a ver las capas

Los autores usaron un conjunto de datos público de fotografías de testigos de alta resolución de depósitos del Holoceno (últimos ~11.700 años) del norte de Italia. Cada imagen fue etiquetada cuidadosamente en seis facies principales —arena fluvial, fangos de llanura de inundación bien y mal drenados, depósitos de pantano, capas de turba y limos marinos (prodelta)— más una clase de fondo. Entrenaron varias versiones de una arquitectura de segmentación de imágenes popular, U‑Net, cada una con un “backbone” diferente que aprende rasgos visuales. Al comparar la precisión y métricas relacionadas en un conjunto de validación y en un conjunto de prueba no visto, encontraron que un modelo basado en el backbone EfficientNet‑B7 ofrecía el mejor equilibrio entre alto rendimiento y generalización fiable a nuevos testigos.

Mirar la roca con un lente más amplio

Los geólogos humanos rara vez deciden una facies basándose en un punto diminuto; leen tendencias a lo largo del testigo, como afinamientos o engrosamientos graduales de las capas. Para imitar esto, el equipo probó cuánto contexto vertical debía ver la IA a la vez entrenando la mejor arquitectura con distintos tamaños de parches recortados de las imágenes. Cuando el modelo vio solo pequeños parches de 128×128 píxeles, sus predicciones eran ruidosas y las bandas de facies parecían fragmentadas. A medida que el tamaño de parche aumentó a 256 y 384 píxeles hasta 512×512 píxeles, la segmentación se volvió más suave y más cercana a la interpretación experta, conservándose los cuerpos de facies como unidades continuas. Las ganancias de rendimiento se estabilizaron entre 384 y 512 píxeles, lo que sugiere que aproximadamente esa escala captura la mayor parte del contexto útil para la tarea.

Figure 2
Figure 2.

Abrir la caja negra con mapas de calor y de incertidumbre

Las puntuaciones altas no bastan cuando la IA informa decisiones sobre riesgos o recursos; los usuarios necesitan ver cómo y dónde mira el modelo. Por ello, los autores aplicaron dos familias de herramientas de explicabilidad. Primero, usaron Grad‑CAM para producir mapas de saliencia —mapas de calor que resaltan las regiones de la imagen más influyentes para cada decisión de facies. Estos mapas concordaron bien con las facies etiquetadas, enfatizando, por ejemplo, zonas ricas en materia orgánica para turba y pantano y separando claramente el sedimento del fondo. Es importante que cierto solapamiento, como activaciones de turba dentro de áreas de pantano, coincidiera con la forma en que los sedimentólogos agrupan conceptualmente estos ambientes. Segundo, estimaron la entropía predictiva ejecutando el modelo muchas veces con dropout aleatorio y resumiendo cuán estables eran sus predicciones en cada píxel. Las zonas de alta entropía aparecían a menudo cerca de los límites entre facies, en arenas interestratificadas finas dentro de fangos o en porciones de testigos alteradas durante el sondeo —precisamente donde los expertos dudarían. Sin embargo, muchas áreas de alta incertidumbre seguían siendo clasificadas correctamente, señalando intervalos que merecen una segunda mirada más que un rechazo absoluto de los resultados.

Del estudio de caso a una herramienta práctica

En conjunto, este trabajo entrega más que un modelo preciso: ofrece una canalización completa y transparente para el análisis de testigos sedimentarios. Al elegir cuidadosamente la arquitectura de la red, empatar su campo de visión con el razonamiento humano y emparejar cada predicción con explicaciones visuales y estimaciones de incertidumbre, los autores muestran cómo la IA puede apoyar en lugar de reemplazar el juicio experto. El mismo enfoque puede adaptarse a otras imágenes en geociencias —desde deslizamientos hasta rocas reservorio— donde la confianza, la interpretabilidad y los datos abiertos son tan cruciales como la precisión bruta.

Cita: Di Martino, A., Carlini, G. & Amorosi, A. Explainable artificial intelligence for sedimentary facies segmentation. Sci Rep 16, 5984 (2026). https://doi.org/10.1038/s41598-026-36765-y

Palabras clave: IA explicable, facies sedimentarias, imágenes en geociencias, análisis de testigos, incertidumbre del modelo