Clear Sky Science · zh

U-Trans:用于地震波形表示与增强下游地震任务的基础模型

· 返回目录

为什么更智能的地震“倾听”很重要

地震往往突如其来,但它们通过地球传播的振动携带着丰富的信息。将这些震动信号快速、可靠地转化为答案——发生在哪里?有多大?哪个断层活动了?——是现代地震监测系统的任务。本研究引入了一种新的“倾听”地震波的方式,使用一个强大的通用人工智能模型,旨在同时提升多种地震相关任务的性能,并在标签数据稀缺时仍能表现良好。

为地震数据构建一种新的通用“大脑”

现有的大多数地震AI工具是专门化的:一个网络负责检测关键波到达,另一个估计震级,再有一个定位,等等。它们通常在单一地区训练,迁移到其他地区时表现不佳。作者提出了一种受语言与视觉领域基础模型启发的不同策略:构建一个大型模型,称为 U-Trans,从数百万个样本中学习地震波形的丰富内部表示,然后将该表示共享给多个下游工具。U-Trans 并非替代现有模型,而是充当一个通用的“特征引擎”,为它们提供额外的信息信号。

Figure 1
Figure 1.

通过隐藏片段来教会模型

训练 U-Trans 不需要人工标注诸如事件时间或震级等标签。研究人员使用一种自监督任务:选取来自多个全球数据集的真实三分量地震记录,故意在时间和频率上移除约三分之一的内容,然后让网络重建被遮蔽的部分。在架构上,U-Trans 将捕捉波形细微局部摆动的 U 形编码器—解码器,与中间的紧凑 Transformer 模块结合,后者学习波形跨越长距离的关系。“填补空白”的学习方式迫使模型内化 P 波与 S 波的物理特性,并区分有意义的信号与噪声。

能追踪关键波到达的隐藏模式

在大约 250 万条地震记录上训练后,U-Trans 能够忠实地重建被破坏的波形,表明它已把数据的基本结构捕捉到。当作者检查内部潜在特征——即模型对每个波形形成的压缩内部图像——时,他们发现这些特征在 P 波和 S 波到达时间附近会显著激活,这些正是地震监测中使用的主要波型。对于没有真实事件的噪声记录,潜在模式则呈弥散且无结构。另一种可视化技术显示,尽管模型从未被明确告知哪是地震哪是噪声,其内部表示自然地将地震信号与噪声分群开来。

同时提升多项地震任务

为了检验这些学习到的特征是否真正有用,作者将 U-Trans 接入若干既有的深度学习工具:一个用于拾取 P 波和 S 波到达时间,一个用于单站数据定位,一个用于估计震级,另一个用于分类 P 波的首动向上或向下。对于每项任务,他们将 U-Trans 的潜在特征作为第四个输入通道,连同原始三分量地震记录一起加入,并对组合系统进行微调。在来自加州、德州、意大利和日本的数据集——包括原始训练中未使用的区域——上,这一简单的附加始终降低了误差。波到达时间的拾取更为准确,距阵与深度估计更精确,震级预测与目录值更一致,极性分类也有所提升,即便仅有少量标注数据可用时仍然如此。

Figure 2
Figure 2.

这对未来地震监测意味着什么

研究表明,一个单一的自监督基础模型可以学习到一种通用的地震振动“语言,从而惠及多种监测任务。通过专注于重建部分被遮蔽的波形,U-Trans 自然强调了地震学家最关心的波到达时间,然后将这一提炼的信息传递给下游模型。在实践中,这种方法有望带来更准确和更稳健的地震目录、在训练数据有限的区域表现更好,以及提供一个可随着新任务出现而扩展的灵活框架。对公众而言,这是朝着更快速、更可靠判断何时、何地以及地球震动强度的一步。}

引用: Saad, O.M., Chen, Y. & Alkhalifah, T. U-Trans: a foundation model for seismic waveform representation and enhanced downstream earthquake tasks. Sci Rep 16, 12657 (2026). https://doi.org/10.1038/s41598-026-41454-x

关键词: 地震监测, 地震波形, 深度学习, 基础模型, 自监督学习