Clear Sky Science · pt
Estimativa de recalque induzido por liquefação de fundações rasas por aprendizado de máquina com dados desbalanceados
Por que o solo que treme importa para edifícios do dia a dia
Quando um terremoto forte atinge, um terreno que parecia sólido pode comportar-se temporariamente como um líquido, fazendo com que edifícios afundem, fiquem inclinados ou rachem. Esse fenômeno, chamado liquefação, danificou moradias e infraestrutura em muitos terremotos recentes, da Turquia ao Japão. Engenheiros sabem que mesmo algumas dezenas de centímetros de recalque desigual podem tornar um edifício inseguro ou inutilizável. Ainda assim, prever quanto um edifício específico irá afundar com base em dados de campo limitados continua sendo difícil. Este estudo explora como ferramentas modernas de aprendizado de máquina podem transformar relatos de caso dispersos de terremotos reais em um método prático para antecipar danos relacionados à liquefação e guiar projetos mais seguros, decisões de seguros e inspeções pós-desastre. 
De relatórios de caso dispersos a um conjunto de dados global de terremotos
Os pesquisadores começaram reunindo um banco de dados mundial com 206 edifícios que sofreram falhas de solo relacionadas à liquefação durante terremotos passados. Para cada caso, coletaram informações simples que costumam estar disponíveis na prática: a intensidade da agitação no local, a altura total e a largura do edifício, a pressão que o edifício exerce sobre sua fundação e propriedades chave das camadas de solo subjacentes — especialmente a profundidade da primeira camada suscetível à liquefação e sua espessura. Em vez de tentar calcular um recalque exato em centímetros, agruparam os resultados em quatro níveis de dano, desde ausência de recalque visível até afundamento e inclinação extensivos. Esse “índice de falha do solo” converte medições do mundo real, muitas vezes confusas, em categorias claras que podem ser usadas para treinar e testar modelos de aprendizado de máquina.
Ensinando computadores a identificar padrões perigosos em dados desiguais
Registros reais de terremotos estão longe de ser ordenados: alguns tipos de dano são comuns enquanto outros são raros, e as variáveis de entrada podem conter valores atípicos e ruído. Neste conjunto de dados, casos de dano severo foram muito mais frequentes do que os moderados, criando um forte desequilíbrio que pode induzir muitos algoritmos a negligenciar a classe mais rara. Para enfrentar isso, os autores combinaram sistematicamente várias estratégias. Eles limparam os dados com métodos de filtragem de outliers e então exploraram duas abordagens complementares para lidar com o desbalanceamento: copiar artificialmente casos minoritários (amostragem aleatória por oversampling) e instruir os algoritmos a tratar erros em classes raras como mais custosos (aprendizado sensível ao custo). Para evitar resultados excessivamente otimistas, todas essas etapas foram encapsuladas em um fluxo de trabalho rigoroso “livre de vazamento”, no qual os dados de teste permaneceram completamente ocultos durante o treinamento, ajuste e reamostragem dos modelos.
Quais fatores e modelos capturam melhor o risco de recalque?
Vários modelos amplamente usados foram testados, incluindo florestas aleatórias, métodos de gradient boosting, uma rede neural artificial e um conjunto (ensemble) que faz a média das previsões de múltiplos modelos. Como a acurácia geral pode ocultar desempenho ruim em níveis de dano raros, porém importantes, a equipe enfatizou a sensibilidade (recall) — quantos dos casos realmente severos o modelo identifica corretamente — como métrica chave. Gradient Boosting e um ensemble de modelos baseados em árvores surgiram como as opções mais confiáveis, particularmente quando combinados com oversampling aleatório, tratamento cuidadoso de outliers e limiares de decisão ajustados. Para entender a que os modelos estavam “prestando atenção”, os autores usaram SHAP, uma ferramenta que decompõe cada previsão em contribuições das variáveis individuais. Essa análise mostrou que a profundidade até a primeira camada suscetível à liquefação foi o fator isolado mais influente, seguido pela intensidade do tremor e pela geometria básica da fundação, como a largura do edifício. Em termos simples, camadas rasas e facilmente liquefáveis sob fundações estreitas foram consistentemente associadas aos danos mais graves. 
Testando a abordagem em estudos de caso reais de terremotos
Para verificar se seus métodos funcionariam fora da amostra de treinamento, os pesquisadores aplicaram os modelos finais a quatro estudos de caso detalhados de terremotos bem conhecidos, incluindo o evento de Loma Prieta em 1989 na Califórnia, o terremoto de Kocaeli em 1999 na Turquia, a sequência de Kumamoto em 2016 no Japão e o terremoto de Kahramanmaraş em 2023 na Turquia. Nesses exemplos, as únicas entradas foram estimativas simples da intensidade do tremor, dimensões e cargas do edifício e a profundidade e espessura das camadas suscetíveis à liquefação obtidas em ensaios de campo. Os modelos, de modo geral, coincidiram com a severidade observada do recalque, identificando corretamente tanto danos leves quanto extensos. Em um caso, o modelo errou intencionalmente pelo lado da segurança ao prever uma classe de dano mais alta do que a reportada. Os autores argumentam que, em cenários de alto risco como resiliência sísmica, previsões conservadoras desse tipo são preferíveis a deixar de identificar edifícios severamente danificados.
Uma ajuda orientada por dados para cidades mais seguras em terrenos moles
Este trabalho não substitui fórmulas tradicionais baseadas em física para cálculo de recalque, que permanecem essenciais quando há resultados detalhados de ensaios de solo. Em vez disso, oferece uma ferramenta complementar: uma forma transparente e orientada por dados para classificar edifícios em categorias amplas de risco usando um pequeno conjunto de parâmetros rotineiramente coletados. Ao lidar cuidadosamente com dados desbalanceados, evitar vieses ocultos na avaliação e revelar quais características do solo e das edificações têm maior importância, a estrutura de aprendizado de máquina proposta fornece a engenheiros, planejadores e seguradoras um auxílio prático de alerta precoce. Em regiões construídas sobre solos moles e saturados de água, pode ajudar a priorizar quais edifícios têm maior probabilidade de sofrer afundamento e inclinação perigosos quando o próximo grande terremoto ocorrer.
Citação: Sargin, S., Korkmaz, G., Yildirim, A.K. et al. Estimation of liquefaction-induced settlement of shallow foundation by machine learning with imbalanced data. Sci Rep 16, 11198 (2026). https://doi.org/10.1038/s41598-026-41969-3
Palavras-chave: liquefação do solo, engenharia sísmica, aprendizado de máquina, assentamento de edificações, risco sísmico