Clear Sky Science · zh

用于沉积相分割的可解释人工智能

2026-01-22 · 返回目录

从岩芯读懂地球历史

为了了解河流、三角洲和海岸线如何演化——以及我们城市下方的地基究竟有多稳定——地质学家研究从地下钻取的长柱状沉积物样本。解读这些岩芯是缓慢且需要专家的工作。该研究展示了人工智能（AI）如何与揭示其内部推理过程的工具相结合，帮助自动化这项任务，同时仍让科学家看到计算机得出某一结论的原因。

为何岩芯重要

地下沉积物记录了过去的洪水、海平面变化、地震和气候转变。专家将每根岩芯划分为“相”（facies），即反映不同环境的层位，例如河道、泛滥平原、沿海沼泽或近岸泥质沉积。这些区分指导着从古气候重建到地震危害与地基稳定性评估的各类工作。但细致的相位制图需要多年沉积学训练，即便专家在地层相似或岩芯受损时也会遇到模糊情形。使这项工作更易获得且更一致，是应用AI的重要动机之一。

教神经网络识别层理

作者使用了来自意大利北部全新世（约过去1.17万年）沉积物的高分辨率岩芯照片公共数据集。每张图像被细致标注为六种主要相——河流砂、良好与排水不良的泛滥平原泥、沼泽沉积、泥煤层以及近海（前三角洲）粘土——外加一个背景类别。研究者训练了多种基于流行图像分割架构U‑Net的模型，每个模型采用不同的“骨干网”来学习视觉特征。通过在验证集和未见过的测试集上比较准确率及相关指标，他们发现基于EfficientNet‑B7骨干的模型在高性能与对新岩芯的可靠泛化之间提供了最佳平衡。

用更广的视角看岩石

人类地质学家很少仅凭一个小点就判定相；他们沿着岩芯上下读取趋势，例如粒度逐渐变细或层位变厚。为模拟这一点，研究组测试了AI一次应看到多少垂直上下文，将最佳架构在从图像中裁切出的不同块尺寸上训练。当模型仅查看小的128×128像素块时，预测噪声较大，相位带表现为断裂。随着块尺寸增大到256、384直至512×512像素，分割变得更平滑、更接近专家解读，相位体保持为连续单位。性能提升在384到512像素之间趋于平缓，表明该尺度大致捕捉到任务所需的大部分有用上下文。

用热图与不确定性图打开黑箱

在AI用于危害或资源决策时，高分数本身不足以让人放心；用户需要看到模型“在看哪里”。因此作者应用了两类可解释性工具。首先，他们使用Grad‑CAM生成显著性图——热图突出显示对每种相判定影响最大的图像区域。这些图与标注的相位良好对齐，例如突出有机质丰富区以识别泥炭与沼泽，并清楚地区分沉积物与背景。值得注意的是，某些重叠（如泥炭在沼泽区域的激活）符合沉积学家概念上将这些环境归类的方式。其次，他们通过多次以随机dropout运行模型并汇总各像素预测的稳定性来估计预测熵。高熵区域常出现在相界附近、泥中夹薄砂层或钻取过程中受扰动的岩芯段——恰恰是专家也会犹豫的地方。但许多高不确定性区域仍被正确分类，提示这些间隔值得再次审查，而不应完全否定结果。

从个案研究到实用工具

这项工作不仅提供了一个准确的模型：它还提供了用于岩芯分析的完整透明流程。通过谨慎选择网络架构、将其视野与人类推理相匹配，并为每次预测配上可视化解释与不确定性估计，作者展示了AI如何支持而非取代专家判断。同样的方法可以适配到其他地球科学影像——从滑坡到储层岩石——在这些领域，可信赖性、可解释性与开放数据与原始准确性同等重要。

引用: Di Martino, A., Carlini, G. & Amorosi, A. Explainable artificial intelligence for sedimentary facies segmentation. Sci Rep 16, 5984 (2026). https://doi.org/10.1038/s41598-026-36765-y

关键词: 可解释的人工智能, 沉积相, 地球科学成像, 岩芯分析, 模型不确定性