Clear Sky Science · ru

Машинное обучение для оперативной оценки макросейсмической интенсивности по сейсмометрическим данным в Италии

· Назад к списку

Почему важны быстрые оценки подземных толчков

Когда земля начинает трястись, спасательным бригадам даются считанные минуты, чтобы решить, куда направлять людей и ресурсы. В то же время привычный способ описания того, насколько сильно ощущается землетрясение на поверхности — макросейсмическая интенсивность, например шкала Меркалли, используемая в Италии — часто появляется лишь через часы, дни или даже месяцы, после заполнения опросников и полевых осмотров экспертами. В этой статье рассматривается, как современные методы машинного обучения могут преобразовать первые показания сейсмометров в быстрые и достаточно точные карты того, насколько сильно ощущалось землетрясение, помогая властям действовать быстрее и увереннее.

Figure 1
Figure 1.

От сообщений очевидцев к оперативным оценкам

Традиционные оценки интенсивности в Италии опираются на два основных потока данных. Первый состоит из экспертных полевых обследований, внесенных в официальную базу данных: они ориентированы на поврежденные участки, но требуют времени на организацию. Второй поступает из онлайн-системы «Hai Sentito Il Terremoto», где граждане сообщают, что они почувствовали и увидели, давая множество наблюдений низкой и умеренной интенсивности. Оба источника измеряют интенсивность по шкале Меркалли-Канканьи-Сиберг, которая ранжирует толчки от очень слабых до разрушительных на основе реакций людей и зданий. Чтобы связать эти ориентированные на людей меры с инструментальными показаниями, авторы объединили два набора данных вокруг каждой сейсмической станции, усреднив все зарегистрированные интенсивности в радиусе 5 км, чтобы получить одно репрезентативное значение для этой области, и округлили его до целочисленного класса от 1 до 8.

Обучение «леса» моделей читать колебания

Исследователи сформулировали задачу оценки интенсивности как задачу классификации: по ранним измерениям предсказать, какой из восьми классов интенсивности будет иметь место в окрестностях каждой станции. Они использовали случайный лес — ансамбль из множества деревьев решений, каждое из которых выполняет простую последовательность «если—то» разбиений по данным, например по сочетаниям магнитуды, глубины, расстояния от эпицентра и прямых мер движения грунта, таких как пиковое ускорение, скорость и смещение. Обученный на 5 466 наблюдениях от 523 землетрясений по всей Италии (2008–2020), модель усвоила сложные, нелинейные связи между тем, что фиксируют сейсмометры, и тем, что сообщают люди. Чтобы учесть редкость сильных толчков в данных, авторы скорректировали процесс обучения так, чтобы все уровни интенсивности учитывались одинаково, что предотвращало сосредоточение модели только на наиболее частых, слабых событиях.

Figure 2
Figure 2.

Сверка с установленными эмпирическими уравнениями

Чтобы оценить, действительно ли подход на базе машинного обучения добавляет ценность, команда сравнила его прогнозы с двумя широко используемыми семействами эмпирических зависимостей. Первое, называемое уравнениями предсказания интенсивности (Intensity Prediction Equations), оценивает интенсивность главным образом по магнитуде, глубине и расстоянию, предполагая, что амплитуда колебаний плавно убывает с расстоянием. Второе, уравнения превращения параметров движения грунта в интенсивность (Ground Motion to Intensity Conversion Equations), переводит инструментальные измерения пикового движения в ожидаемые классы интенсивности. Эти формулы компактны и просты в применении, но они не в состоянии полностью отразить влияние локальной геологии, состава застройки или направления распространения волн на ощущения людей. Напротив, случайный лес естественно интегрирует и параметры источника, и меры движения грунта, и может адаптироваться к тонким закономерностям в итальянском наборе данных без заранее заданной жесткой математической формы.

Взгляд внутрь «черного ящика» и его ограничения

Поскольку руководителям экстренных служб важно понимать основания автоматических решений, авторы построили более простые «суррогатные» деревья решений, имитирующие поведение случайного леса. Эти меньшие деревья можно изобразить в виде схем, показывающих, какие пороги движения грунта отделяют низкую интенсивность от высокой и где доминируют такие переменные, как ускорение и скорость. Этот анализ показал, что прямые меры движения грунта, особенно пиковое ускорение и скорость, имеют больший вес, чем одни только магнитуда или глубина. Авторы также предложили простой способ отметить степень неопределенности каждого прогноза суррогатного дерева, используя меры смешанности тренировочных примеров в каждом конечном ответвлении. В то же время они обнаружили, что очень сильные интенсивности по-прежнему трудно предсказывать, отчасти потому, что они естественно редки в историческом архиве, что приводит к периодическому занижению самых высоких уровней толчков.

Проверка в реальном событии: недавнее землетрясение в Италии

Команда протестировала свою систему на заметном реальном событии: землетрясении магнитуды 5.5 у Адриатического побережья вблизи Пезаро-Урбино в 2022 году. Примерно за 15 минут сейсмологи получили необходимые сведения об источнике и движении грунта, но было подано лишь около 90 публичных сообщений об ощущениях, что давало очень фрагментарную картину. Используя только инструментальные данные, случайный лес и его суррогатное дерево за доли секунды сгенерировали подробные оценки интенсивности вокруг сотен станций на стандартном компьютере. При последующем сопоставлении с гораздо более плотной картой, построенной на более чем 12 000 гражданских сообщений, собранных в течение нескольких дней, карты машинного обучения удачно отразили как общую зону ощущений, так и распределение умеренных толчков, и по качеству сопоставлялись или превосходили классические уравнения.

Что это значит для людей, живущих в сейсмоопасных зонах

В целом исследование показывает, что тщательно обученная система машинного обучения может взять первые минуты данных с сейсмометров и выдать оперативные, относительно прозрачные карты воздействия землетрясения. Эти карты не заменяют подробные обследования или краудсорсинговые отчеты, но могут заполнить опасный ранний разрыв, когда властям приходится выбирать, куда направлять машины скорой помощи, пожарные и инспекторов зданий при очень ограниченной информации. Комбинируя передовые алгоритмы с интерпретируемыми упрощенными моделями и простыми индикаторами неопределенности, предложенная структура представляет собой практический шаг к более быстрому и обоснованному реагированию на землетрясения в Италии и может быть адаптирована для других регионов с похожими сейсмическими рисками.

Цитирование: Patelli, L., Cameletti, M., De Rubeis, V. et al. Machine learning for prompt estimation of macroseismic intensity from seismometric data in Italy. Sci Rep 16, 7265 (2026). https://doi.org/10.1038/s41598-026-35740-x

Ключевые слова: интенсивность землетрясения, машинное обучение, случайный лес, сейсмическая опасность, Италия