Clear Sky Science · fr
Évaluation des modèles Lasso et Ridge pour la prédiction du potentiel de gonflement des sols
Pourquoi le sol sous les bâtiments compte
De nombreux bâtiments et routes semblent solides, mais le sol qui les soutient peut discrètement gonfler et se contracter en fonction de ses variations d’humidité. Ces mouvements cachés peuvent fissurer les murs, incliner les fondations et endommager les canalisations, entraînant des milliards de coûts de réparation dans le monde. L’article résumé ici explore comment les outils de données modernes peuvent aider les ingénieurs à prévoir quand et où le sol est susceptible de gonfler, afin que maisons, routes et autres ouvrages puissent être conçus pour rester sûrs et stables.

Des sols qui « respirent » l’eau
Tous les sols ne réagissent pas de la même manière lorsqu’ils s’humidifient. Les sols fins riches en argile peuvent absorber l’eau et se dilater comme une éponge, puis se contracter en séchant. Ce cycle répétitif est particulièrement marqué dans les régions arides et semi‑arides, où les alternances humide‑sec sont fréquentes et accentuées. Traditionnellement, les ingénieurs s’appuient sur des essais de laboratoire chronophages pour mesurer des propriétés telles que la teneur en argile, la densité du sol et sa plasticité lorsqu’il est mouillé. Ces tests révèlent si un sol est susceptible de gonfler et de se fissurer, mais ils sont coûteux à réaliser pour chaque site et chaque projet.
Transformer des mesures de sol en prédictions intelligentes
Pour réduire le recours systématique aux essais en laboratoire, les chercheurs ont rassemblé quatre ensembles importants de données issues d’études antérieures en Asie, en Afrique et en Europe. Ensemble, ces jeux comptaient 273 échantillons de sol et 16 descripteurs différents par échantillon, incluant la teneur en argile et en limon, les niveaux d’humidité, la densité et des mesures de consistance standard. Pour chaque échantillon, l’équipe disposait également d’un « potentiel de gonflement » mesuré, indiquant l’amplitude d’expansion du sol lors d’un essai contrôlé. Ils ont soigneusement nettoyé et normalisé les données, éliminé les informations redondantes et réparti les échantillons en groupes d’entraînement et de test afin que toute méthode de prédiction soit évaluée sur des données non vues auparavant.
Anciennes et nouvelles manières de lire le sol
Le noyau de l’étude est une comparaison directe entre un outil statistique familier et deux approches plus modernes. L’outil traditionnel, appelé régression linéaire multiple, estime le potentiel de gonflement comme une combinaison linéaire de toutes les mesures de sol. Les méthodes plus récentes, connues sous les noms de régression Lasso et Ridge, utilisent toujours une combinaison pondérée des mêmes mesures mais ajoutent une sorte de « pénalité » qui décourage le modèle de s’appuyer trop fortement sur une entrée ou d’en utiliser trop simultanément. En pratique, cela signifie que Lasso peut automatiquement annuler les propriétés moins importantes, mettant en lumière la poignée de caractéristiques du sol qui expliquent réellement le gonflement, tandis que Ridge conserve toutes les caractéristiques mais atténue leur influence lorsque celles‑ci sont fortement corrélées entre elles.
Ce que les modèles ont appris sur les sols gonflants
Sur les quatre jeux de données, les modèles régularisés — Lasso et Ridge — ont systématiquement produit des prédictions plus fiables que la méthode traditionnelle. Sur les jeux de données les mieux comportés, Lasso en particulier a suivi de très près le potentiel de gonflement mesuré, avec de faibles erreurs moyennes et une grande part de la variance naturelle expliquée. Les deux méthodes modernes ont mieux géré des propriétés de sol bruyantes et chevauchantes que l’approche linéaire plus ancienne, qui tendait souvent à surestimer ou sous‑estimer le gonflement, surtout pour les valeurs élevées. L’analyse a également confirmé que certains traits, comme la limite liquide, la plasticité et la teneur en argile, constituent les principaux signaux du risque de gonflement, tandis que des facteurs associés à un sol plus dense et moins poreux tendent à réduire ce risque.

Des données à des fondations plus sûres
Pour un non‑spécialiste, le message clé est que les essais de sol existants peuvent désormais être combinés à des modèles pilotés par les données pour repérer rapidement les zones où le terrain est susceptible de soulever et de fissurer les structures. En utilisant les régressions Lasso et Ridge, les ingénieurs peuvent se concentrer sur un plus petit ensemble de propriétés de sol réellement importantes et obtenir des estimations du gonflement plus précises sans réaliser tous les essais possibles sur chaque site. Cela permet de concevoir dès l’origine des fondations, des chaussées et des travaux de terre dans les régions sujettes au gonflement avec des mesures de protection appropriées, réduisant ainsi le risque de dommages coûteux au cours de la vie des ouvrages.
Citation: Bility, M.T., Vora, T., Lakhani, P.N. et al. Assessment of Lasso and Ridge models for soil swelling potential prediction. Sci Rep 16, 11922 (2026). https://doi.org/10.1038/s41598-026-39917-2
Mots-clés: sol expansif, gonflement des sols, apprentissage automatique, régression Lasso, génie géotechnique