Clear Sky Science · zh
使用机器学习从意大利地震仪数据快速估计宏震烈度
为何快速震情评估至关重要
当地面开始震动时,应急团队只有几分钟来决定将救援人员和资源派往何处。然而,通常描述地表感受震动强度的方式——宏震烈度,例如意大利使用的梅尔卡利量表——往往要在数小时、数天甚至数月后才出现,需等到民众填写问卷并由专家调查损害情况后才能得出。本文探讨现代机器学习如何将首批地震仪读数转化为快速且较为准确的烈度分布图,帮助当局更快、更有把握地做出反应。

从感受报告到快速估计
意大利的传统烈度估计依赖两类主要数据来源。一类是记录在官方数据库中的专家现场调查,侧重受损严重的地点,但组织起来需要时间;另一类来自在线“你感觉到地震了吗”系统(Hai Sentito Il Terremoto),民众在此举报他们的感受与所见,提供大量低至中等烈度的观测。这两类来源都采用梅尔卡利–坎卡尼–西贝格(Mercalli-Cancani-Sieberg)烈度等级,根据人和建筑的反应将震感从极弱到破坏性进行分级。为将这些以人为中心的度量与仪器记录联系起来,作者将两套数据按各地震台站合并,在台站周围5公里范围内对所有报告的烈度取平均,得到该区域的单一代表值,并将其四舍五入为1到8的整数等级。
教一片模型森林读懂震动
研究人员将烈度估计设定为分类问题:根据早期测量,预测每个台站周边属于八个烈度类别中的哪一类。他们使用了随机森林(一种由许多决策树组成的集成方法),每棵树通过一系列简单的“如果——那么”分裂在数据上做出判断,考虑的变量包括震级、震源深度、与震中距离以及诸如峰值加速度、速度和位移等直接地面运动量。模型在来自意大利的523次地震(2008–2020)共5,466个观测样本上训练,从而学会了地震仪记录与民众报告之间复杂的非线性联系。为处理强烈震动在数据中较为稀少的事实,作者在训练时进行了调整,使所有烈度级别在训练中同等重要,避免模型只专注于最常见的弱震事件。

与既有经验关系的比较
为评估机器学习方法是否真正带来增值,团队将其预测与两类广泛使用的经验关系进行了比较。第一类称为烈度预测方程(Intensity Prediction Equations),主要根据地震的震级、深度和距离估计烈度,假定震动随距离平滑衰减。第二类称为地动到烈度转换方程(Ground Motion to Intensity Conversion Equations),将仪器记录的峰值动量转换为预期的烈度等级。这些公式简洁且易于应用,但难以充分捕捉局部地质、建筑结构或波向等如何影响人们感受的因素。相比之下,随机森林自然地将震源参数与地动量度量整合起来,并能在不预先设定僵化数学形式的情况下适应意大利数据中的细微模式。
洞察“黑箱”与其局限
鉴于应急管理者需要理解自动决策的依据,作者构建了更简单的“替代”决策树来模拟随机森林的行为。这些更小的树可以绘制成图示,显示哪些地动阈值将低烈度与高烈度区分开来,以及诸如加速度和速度等变量在哪些地方占主导地位。该分析显示,直接的地面运动量度,尤其是峰值加速度和峰值速度,比单独的震级或深度更为重要。作者还引入了一种简单方法来标记每个替代树预测的不确定性,利用最终分支中训练样本的混合程度作为度量。与此同时,他们发现非常强的烈度仍然难以预测,部分原因是历史记录中这类事件本就稀少,导致对最高烈度的偶发低估。
在一次近期意大利地震中的实测
团队在一次显著的真实事件上评估了他们的框架:2022年亚得里亚海岸近佩萨罗—乌尔比诺附近发生的5.5级地震。在大约15分钟内,地震学家获得了必要的震源和地动信息,但只有约90份公众烈度报告被提交,造成极为零散的观测。仅使用仪器数据,随机森林及其替代树在标准计算机上不到两秒钟就能为数百个台站生成详细的烈度估计。后来将这些机器学习地图与数日内收集的超过12,000份市民报告构建的更密集地图比较时,机器学习生成的图不仅很好地捕捉到了总体感受区域和中等震动的分布,而且在匹配或优于传统经验公式方面表现出色。
对生活在地震区人群的意义
总体而言,这项研究表明,经细致训练的机器学习系统可以利用地震仪记录的前几分钟数据,生成快速且较为透明的地震影响地图。这些地图并不能取代详细的现场调查或群众报告,但它们可以弥合当局在信息极度有限时必须决定将救护车、消防队和结构检查人员派往何处的危险早期空白。通过将先进算法与可解释的简化模型和基础不确定性标记结合,该框架为在意大利实现更快、更有信息支持的地震响应提供了切实可行的一步,并可适配于面临类似地震风险的其他地区。
引用: Patelli, L., Cameletti, M., De Rubeis, V. et al. Machine learning for prompt estimation of macroseismic intensity from seismometric data in Italy. Sci Rep 16, 7265 (2026). https://doi.org/10.1038/s41598-026-35740-x
关键词: 地震烈度, 机器学习, 随机森林, 地震危险性, 意大利