Clear Sky Science · fr
Inférence causale assimilative
Pourquoi retracer les causes à rebours importe
Lorsque nous demandons ce qui a provoqué une tempête, un krach boursier ou une crise d’épilepsie, nous remontons généralement le temps pour relier les points. Pourtant, la plupart des outils mathématiques d’« inférence causale » font en réalité courir le temps vers l’avant : ils examinent comment les conditions d’aujourd’hui façonnent les résultats de demain, moyennés sur de longues séries. Cet article présente une nouvelle façon de penser qui reflète plutôt notre intuition. Il expose l’inférence causale assimilative (ICA), un cadre qui utilise des techniques de type prévision météorologique pour retracer les causes à rebours à partir de leurs effets observés, instant par instant, même dans des systèmes bruyants et complexes comme le climat ou le cerveau.
Un nouvel angle sur la cause et l’effet
Les méthodes causales traditionnelles se répartissent habituellement en deux familles. Les techniques basées sur les données recherchent des motifs dans de longues séries temporelles multivariées, en se demandant si l’ajout d’information sur une variable améliore la prédiction d’une autre. Les approches fondées sur des modèles, courantes en physique et en climatologie, utilisent des équations et les font tourner vers l’avant à partir de conditions initiales légèrement différentes pour voir comment les résultats varient. Ces deux stratégies ont des limites : elles peinent face à des relations qui changent rapidement, à des séries courtes et à des systèmes de très haute dimension. L’ICA emprunte une voie différente. Elle considère la causalité comme un problème inverse : au lieu de pousser les causes vers l’avant pour observer leurs effets, elle tire l’information en arrière depuis des effets observés pour inférer leurs causes les plus probables. Pour ce faire, elle s’appuie sur l’assimilation bayésienne des données, la même famille de méthodes utilisée pour combiner modèles météorologiques et observations fraîches.
En pratique, l’ICA suppose que l’on peut observer au moins une variable « d’effet » au fil du temps et que l’on dispose d’un modèle mathématique (éventuellement turbulent et stochastique) décrivant l’interaction des variables du système. Même si certaines causes potentielles ne sont jamais mesurées directement, elles sont représentées dans le modèle. L’ICA utilise deux variantes d’estimation d’état courantes en assimilation de données : le filtrage, qui estime le système à partir des données jusqu’au présent, et le lissage, qui utilise aussi des données futures. Si l’ajout d’informations futures sur l’effet observé resserre nettement nos estimations d’une cause candidate à un instant donné, l’ICA interprète cette réduction d’incertitude comme la preuve que la candidate a réellement influencé l’effet à ce moment-là.

Suivre des rôles changeants dans le temps
Un atout clé de l’ICA est de suivre les relations causales au fil de leur évolution. Beaucoup de systèmes réels présentent de l’intermittence : de longues périodes calmes ponctuées d’épisodes d’activité intense, durant lesquels moteurs et répondeurs peuvent échanger leurs rôles. Les auteurs illustrent ceci à l’aide d’un modèle compact à deux variables qui mime la variabilité atmosphérique et ses événements extrêmes occasionnels. Dans cet exemple, une seule variable est observée. L’ICA révèle quand la variable cachée devient temporairement une source « antidampante » qui injecte de l’énergie dans la variable observée, déclenchant de grandes excursions. Pendant ces phases, la mesure ICA augmente fortement et l’influence inférée s’étend loin dans le futur. Une fois le pic de l’événement extrême passé et la variable observée en décroissance, la force causale de la variable cachée s’effondre, signalant un changement de rôle : l’ancien effet amortit alors fortement son précédent moteur.
Pour aller au‑delà de la simple question « qui influence qui », l’ICA introduit la portée d’influence causale (PIC). Cette grandeur répond à une version temporelle d’une question familière : pendant combien de temps une cause donnée façonne‑t‑elle significativement l’avenir d’un effet ? Techniquement, la PIC se définit en observant la rapidité avec laquelle le gain apporté par l’ajout d’observations futures supplémentaires sature. Si de nouvelles données lointaines dans le temps n’améliorent guère notre estimation d’une cause passée, son influence est considérée comme évanouie. Les auteurs proposent des PICs basées sur des seuils (« subjectives ») et une PIC « objective » qui moyenne sur tous les seuils, analogue à la manière dont les physiciens convertissent des corrélations bruitées en un temps de décorrélation unique. Cela offre une façon mathématiquement fondée de parler de la distance temporelle parcourue par les impacts causaux.
Tester la méthode sur des extrêmes climatiques
L’article applique ensuite l’ICA à un modèle plus réaliste à six variables de l’oscillation El Niño–Southern Oscillation (ENSO), un phénomène climatique qui reconfigure le climat mondial en réchauffant et refroidissant périodiquement l’océan Pacifique tropical. Ce modèle conceptuel reproduit la riche diversité des variantes d’El Niño, y compris les événements centrés dans le Pacifique oriental ou central, ainsi que leurs homologues La Niña. En utilisant des données synthétiques issues du modèle, les auteurs étudient comment différents ingrédients physiques — températures de surface de la mer dans le Pacifique central, profondeur de la couche d’eau chaude à l’ouest, et vents à fluctuations rapides — entraînent conjointement les anomalies de température dans le Pacifique oriental, signature d’El Niño.
L’ICA met au jour un tableau nuancé et résolu dans le temps, conforme à la théorie établie de l’ENSO. Pour de forts événements El Niño de l’est du Pacifique, les températures du Pacifique central apparaissent comme le moteur causal dominant, leur signal ICA culminant légèrement avant le maximum de réchauffement oriental, reflétant la propagation vers l’est des eaux chaudes. Les anomalies de vent montrent une influence plus bruitée mais robuste et presque instantanée, en accord avec leur rôle de poussée des eaux chaudes et d’altération des échanges thermiques. Les variations de la thermocline dans l’ouest du Pacifique, bien qu’importantes, exercent une influence plus indirecte et plus précoce : leurs valeurs ICA culminent des mois avant l’événement, faisant écho à la vision de « recharge–décharge » où la chaleur sous‑surface s’accumule, affecte les températures centrales, puis atteint ensuite l’est. Les estimations de PIC quantifient ces différences : les températures centrales conservent la portée causale la plus longue, les vents la plus courte, et la profondeur sous‑surface une portée intermédiaire. Remarquablement, lorsque l’ICA est appliquée à des observations ENSO réelles mais clairsemées en utilisant un modèle imparfait, elle retrouve malgré tout des patrons causaux qualitativement similaires.

Perspectives : usages élargis et questions ouvertes
Au‑delà de ces bancs d’essai, les auteurs soutiennent que l’ICA convient bien à de nombreux systèmes complexes où une seule réalisation et des séries courtes sont disponibles, mais où un certain modèle des dynamiques existe — exemples : climat à grande échelle, réseaux écologiques, cerveau, voire infrastructures conçues par l’homme. Parce que l’ICA peut intégrer des techniques efficaces d’assimilation par ensembles, elle est conçue pour s’étendre à des problèmes de très haute dimension, évitant certains des fléaux de la dimensionnalité qui pénalisent les méthodes traditionnelles de flux d’information. Le cadre s’étend aussi à des situations comportant de nombreuses variables « de fond » en retirant soigneusement leur incertitude d’observation de l’analyse, de sorte que les liens causaux inférés ne soient pas simplement des effets secondaires d’influences partagées ou de médiateurs.
Ce que cela signifie en termes simples
Dans un langage courant, l’ICA offre un moyen d’observer les causes en action en temps réel, plutôt que de les condenser dans un schéma statique. En empruntant des outils à la prévision météorologique, elle pose une question pragmatique : savoir ce qui va arriver à une quantité observable dans un futur proche nous aide‑t‑il à préciser ce qu’un moteur invisible faisait juste avant ? Si la réponse est oui, l’ICA désigne ce moteur comme causal à cet instant et estime combien de temps son empreinte persiste. Cette vision rétroactive, fondée sur l’incertitude, transforme la causalité en un signal mesurable dans des systèmes complexes et bruités. Si des défis subsistent — en particulier la gestion de modèles imparfaits et du bruit de mesure — l’approche ouvre néanmoins une voie vers des explications plus précises et résolues dans le temps d’événements extrêmes en climatologie et dans d’autres domaines où savoir qui a poussé qui, et quand, peut avoir des conséquences pratiques profondes.
Citation: Andreou, M., Chen, N. & Bollt, E. Assimilative causal inference. Nat Commun 17, 1854 (2026). https://doi.org/10.1038/s41467-026-68568-0
Mots-clés: inférence causale, assimilation bayésienne de données, systèmes dynamiques complexes, événements climatiques extrêmes, Oscillation australe El Niño