Clear Sky Science · zh

U-Trans：用于地震波形表示与增强下游地震任务的基础模型

2026-03-09 · 返回目录

为什么更智能的地震“倾听”很重要

地震往往突如其来，但它们通过地球传播的振动携带着丰富的信息。将这些震动信号快速、可靠地转化为答案——发生在哪里？有多大？哪个断层活动了？——是现代地震监测系统的任务。本研究引入了一种新的“倾听”地震波的方式，使用一个强大的通用人工智能模型，旨在同时提升多种地震相关任务的性能，并在标签数据稀缺时仍能表现良好。

为地震数据构建一种新的通用“大脑”

现有的大多数地震AI工具是专门化的：一个网络负责检测关键波到达，另一个估计震级，再有一个定位，等等。它们通常在单一地区训练，迁移到其他地区时表现不佳。作者提出了一种受语言与视觉领域基础模型启发的不同策略：构建一个大型模型，称为 U-Trans，从数百万个样本中学习地震波形的丰富内部表示，然后将该表示共享给多个下游工具。U-Trans 并非替代现有模型，而是充当一个通用的“特征引擎”，为它们提供额外的信息信号。

通过隐藏片段来教会模型

训练 U-Trans 不需要人工标注诸如事件时间或震级等标签。研究人员使用一种自监督任务：选取来自多个全球数据集的真实三分量地震记录，故意在时间和频率上移除约三分之一的内容，然后让网络重建被遮蔽的部分。在架构上，U-Trans 将捕捉波形细微局部摆动的 U 形编码器—解码器，与中间的紧凑 Transformer 模块结合，后者学习波形跨越长距离的关系。“填补空白”的学习方式迫使模型内化 P 波与 S 波的物理特性，并区分有意义的信号与噪声。

能追踪关键波到达的隐藏模式

在大约 250 万条地震记录上训练后，U-Trans 能够忠实地重建被破坏的波形，表明它已把数据的基本结构捕捉到。当作者检查内部潜在特征——即模型对每个波形形成的压缩内部图像——时，他们发现这些特征在 P 波和 S 波到达时间附近会显著激活，这些正是地震监测中使用的主要波型。对于没有真实事件的噪声记录，潜在模式则呈弥散且无结构。另一种可视化技术显示，尽管模型从未被明确告知哪是地震哪是噪声，其内部表示自然地将地震信号与噪声分群开来。

同时提升多项地震任务

为了检验这些学习到的特征是否真正有用，作者将 U-Trans 接入若干既有的深度学习工具：一个用于拾取 P 波和 S 波到达时间，一个用于单站数据定位，一个用于估计震级，另一个用于分类 P 波的首动向上或向下。对于每项任务，他们将 U-Trans 的潜在特征作为第四个输入通道，连同原始三分量地震记录一起加入，并对组合系统进行微调。在来自加州、德州、意大利和日本的数据集——包括原始训练中未使用的区域——上，这一简单的附加始终降低了误差。波到达时间的拾取更为准确，距阵与深度估计更精确，震级预测与目录值更一致，极性分类也有所提升，即便仅有少量标注数据可用时仍然如此。

这对未来地震监测意味着什么

研究表明，一个单一的自监督基础模型可以学习到一种通用的地震振动“语言，从而惠及多种监测任务。通过专注于重建部分被遮蔽的波形，U-Trans 自然强调了地震学家最关心的波到达时间，然后将这一提炼的信息传递给下游模型。在实践中，这种方法有望带来更准确和更稳健的地震目录、在训练数据有限的区域表现更好，以及提供一个可随着新任务出现而扩展的灵活框架。对公众而言，这是朝着更快速、更可靠判断何时、何地以及地球震动强度的一步。}

引用: Saad, O.M., Chen, Y. & Alkhalifah, T. U-Trans: a foundation model for seismic waveform representation and enhanced downstream earthquake tasks. Sci Rep 16, 12657 (2026). https://doi.org/10.1038/s41598-026-41454-x

关键词: 地震监测, 地震波形, 深度学习, 基础模型, 自监督学习