Clear Sky Science · ru
Оценка осадки фундаментов из‑за ликвафикации с помощью машинного обучения при несбалансированных данных
Почему сотрясаемая земля важна для обычных зданий
Когда происходит сильное землетрясение, казалось бы прочная земля на короткое время может повести себя как жидкость, что приводит к проваливанию, наклону или трещинам в зданиях. Это явление, называемое ликвацией, нанесло ущерб жилым домам и инфраструктуре во многих недавних землетрясениях — от Турции до Японии. Инженерам известно, что даже несколько десятков сантиметров неравномерной осадки могут сделать здание небезопасным или непригодным для использования. Тем не менее предсказать, насколько конкретное здание осядет при ограниченных данных по участку, по-прежнему трудно. В этом исследовании рассматривается, как современные инструменты машинного обучения могут превратить разрозненные кейсы из реальных землетрясений в практический способ прогнозирования ущерба, связанного с ликвацией, и помочь при проектировании, страховании и послезападных осмотрах. 
От разрозненных отчетов к глобальной базе данных землетрясений
Исследователи начали с составления мировой базы данных из 206 зданий, которые пережили деформации грунта, связанные с ликвацией, в прошлых землетрясениях. Для каждого случая они собрали простую информацию, которая часто доступна на практике: интенсивность сотрясений на площадке, общую высоту и ширину здания, давление, которое здание передает на фундамент, и ключевые свойства залегающих грунтов — особенно глубину до первого ликвационного слоя и его мощность. Вместо попыток точно вычислить осадку в сантиметрах они сгруппировали результаты в четыре уровня повреждений — от визуально отсутствующей осадки до обширного проседания и наклона. Этот «индекс разрушения грунта» переводит неупорядоченные реальные измерения в понятные категории, которые можно использовать для обучения и проверки моделей машинного обучения.
Обучение компьютеров распознавать опасные закономерности в несбалансированных данных
Реальные записи землетрясений далеки от аккуратности: одни типы повреждений встречаются часто, другие — редко, а входные переменные могут содержать выбросы и шум. В этой выборке случаи тяжелых повреждений были значительно более частыми, чем умеренные, что создавало сильный дисбаланс и могло ввести многие алгоритмы в заблуждение, заставив их игнорировать самый редкий класс. Чтобы противостоять этому, авторы систематически комбинировали несколько стратегий. Они очищали данные методами фильтрации выбросов, затем изучали два дополняющих подхода к работе с дисбалансом: искусственное размножение миноритарных примеров (случайный оверсэмплинг) и обучение с учетом стоимости ошибок (cost-sensitive learning), при котором ошибки на редких классах оцениваются дороже. Чтобы избежать чрезмерно оптимистичных результатов, все эти шаги были встроены в строгий «без протечек» рабочий процесс, при котором тестовые данные оставались полностью невидимыми на этапах обучения, настройки и ресемплинга моделей.
Какие факторы и модели лучше всего отражают риск осадки?
Были опробованы несколько широко используемых моделей, включая случайные леса, методы градиентного бустинга, искусственную нейронную сеть и ансамбль, усредняющий прогнозы нескольких моделей. Поскольку общая точность может скрывать слабую работу по редким, но важным уровням повреждений, команда сделала акцент на полноте (recall) — на том, какую долю действительно тяжелых случаев модель правильно выявляет, как на ключевом метрике. Градиентный бустинг и ансамбль деревьев показали себя наиболее надежными вариантами, особенно в сочетании со случайным оверсэмплингом, аккуратной обработкой выбросов и тонкой настройкой порогов принятия решений. Чтобы понять, «на что» смотрят модели, авторы использовали SHAP — инструмент, разбивающий каждое предсказание на вклад отдельных признаков. Этот анализ показал, что глубина до первого ликвационного слоя была наиболее влиятельным фактором, за ней следовали интенсивность сотрясений и базовая геометрия фундамента, такая как ширина здания. Проще говоря, мелкие, легко ликвационные слои под узкими фундаментами стабильно ассоциировались с наиболее серьезными повреждениями. 
Проверка подхода на реальных примерах землетрясений
Чтобы проверить, сработают ли их методы за пределами обучающей выборки, исследователи применили финальные модели к четырем подробным примерам из известных землетрясений, включая событие Лома-Приета 1989 года в Калифорнии, землетрясение в Коджаэли (Козджели) 1999 года в Турции, серию событий Кумамото 2016 года в Японии и землетрясение 2023 года в Кахраманмараше (Турция). В этих примерах единственными входными данными были простые оценки интенсивности сотрясений, размеры и нагрузки на здание, а также глубина и мощность ликвационных слоев по полевым испытаниям. Модели в целом соответствовали наблюдаемой степени осадки, корректно определяя как незначительные, так и обширные уровни повреждений. В одном случае модель намеренно ошиблась в пользу осторожности, предсказав более высокий класс повреждения, чем было заявлено. Авторы утверждают, что в ситуациях с высокими ставками, таких как сейсмоустойчивость, такие консервативные прогнозы предпочтительнее, чем пропуск сильно поврежденных зданий.
Данные как инструмент для более безопасных городов на мягких грунтах
Эта работа не заменяет традиционные физически обоснованные формулы расчета осадки, которые остаются необходимыми при наличии подробных результатов исследований грунта. Вместо этого она предлагает дополнительный инструмент: прозрачный, основанный на данных способ сортировать здания по широким категориям риска, используя небольшой набор рутинно собираемых параметров. Тщательно работая с несбалансированными данными, избегая скрытых предвзятостей в оценке и выявляя, какие свойства грунта и зданий имеют наибольшее значение, предложенная схема машинного обучения предоставляет инженерам, планировщикам и страховщикам практичную систему раннего оповещения. В районах, построенных на мягких, насыщенных водой грунтах, она может помочь приоритизировать здания, которые с наибольшей вероятностью пострадают от опасного проседания и наклона при следующем крупном землетрясении.
Цитирование: Sargin, S., Korkmaz, G., Yildirim, A.K. et al. Estimation of liquefaction-induced settlement of shallow foundation by machine learning with imbalanced data. Sci Rep 16, 11198 (2026). https://doi.org/10.1038/s41598-026-41969-3
Ключевые слова: ликвация грунта, сейсмотехника, машинное обучение, осадка зданий, сейсмический риск