Clear Sky Science · fr
Passer du tableau au graphe dans la régression symbolique spatio-temporelle informée par la physique
Apprendre aux ordinateurs à découvrir les lois cachées de la nature
Une grande partie de la science consiste à trouver des règles simples qui expliquent comment le monde évolue dans le temps, du pendule oscillant à la diffusion de la chaleur dans une barre métallique. Cet article explore une nouvelle façon d'aider les ordinateurs à redécouvrir ces règles directement à partir des données en tenant compte non seulement des valeurs numériques, mais aussi du lieu et du moment où elles ont été mesurées. Les auteurs montrent comment la combinaison de deux vues des données, la vue traditionnelle en tableau et une vue en réseau, peut rendre la découverte automatique d'équations plus précise, plus robuste au bruit et plus fidèle à la physique réelle.
Du tableur de nombres aux toiles de connexions
La plupart des outils actuels de découverte automatique d'équations considèrent les données comme un simple tableau, où chaque ligne est une mesure indépendante. Cette configuration fonctionne pour des problèmes simples mais peine face aux systèmes physiques réels, qui évoluent à la fois dans l'espace et dans le temps. Une mesure de température en un point dépend de ses voisins et de ce qui s'est passé un instant plus tôt. Ignorer ces liens peut pousser les ordinateurs à produire des formules qui ajustent bien les données mais manquent la loi sous-jacente réelle. Les auteurs soutiennent que pour respecter le fonctionnement de la nature, il faut une représentation qui conserve l'information sur quelles mesures sont voisines dans l'espace et le temps, et pas seulement leurs valeurs brutes.

Transformer les mesures en un réseau espace-temps
Pour remédier à cela, l'étude introduit une représentation double des données. La première vue est le tableau familier de nombres. La seconde vue est un graphe, un réseau dont les nœuds correspondent à des mesures prises à des lieux et des instants spécifiques, tandis que les arêtes relient des relevés proches spatialement ou temporellement. Ce graphe sert de carte des causes et effets locaux, où les différences le long des arêtes spatiales reflètent les variations spatiales et les différences le long des arêtes temporelles imitent les taux de changement au fil du temps. Un réseau neuronal sur graphe traite ensuite cette structure pour apprendre des caractéristiques compressées, conscientes de la physique, qui mettent en évidence des motifs lisses et cohérents tout en atténuant le bruit aléatoire.
Apprendre aux découvreurs d'équations à écouter la physique
Une fois ces caractéristiques apprises disponibles, elles sont injectées dans des outils de régression symbolique, qui cherchent des équations lisibles par l'humain décrivant les données. L'innovation clé est un nouvel objectif d'entraînement qui juge les équations candidates de deux façons simultanément. D'abord, il vérifie dans quelle mesure les données simulées par une candidate correspondent aux mesures originales. Ensuite, il vérifie si les données simulées, après passage par le réseau neuronal sur graphe, aboutissent dans le même espace « latent » que les données réelles. Cette seconde vérification contraint les équations découvertes à respecter les relations spatiales et temporelles captées par le graphe, éloignant la recherche des formules qui ajustent les nombres mais rompent la structure physique connue.

Mettre la méthode à l'épreuve
Pour évaluer l'efficacité de l'idée, les auteurs ont généré des données synthétiques à partir de dix équations classiques issues de la physique et du génie, incluant des lois pour les ressorts, la conduction de la chaleur, des mouvements fluides et des systèmes à réponses retardées. Pour chaque cas, ils ont ajouté des signaux distrayants et des quantités contrôlées de bruit, puis ont exécuté dix méthodes différentes de recherche d'équations, avec et sans la nouvelle représentation basée sur le graphe. Dans l'ensemble, l'utilisation de la double vue a entraîné des gains modestes mais constants en précision, une meilleure récupération de la forme symbolique correcte et un respect plus étroit des contraintes physiques. Les bénéfices ont été les plus marqués lorsque les données étaient bruitées ou rares, conditions fréquentes dans les expériences réelles.
Ce que cela signifie pour la découverte scientifique future
En termes simples, l'article montre que fournir aux ordinateurs non seulement les nombres, mais aussi un schéma de la façon dont ces nombres sont reliés dans l'espace et le temps, les aide à deviner les bonnes équations de manière plus fiable. En tissant une vue en réseau dans des outils de découverte d'équations par ailleurs standard, la méthode améliore la robustesse sans modifier le fonctionnement interne de ces outils. Bien que les tests présentés utilisent des données simulées soigneusement contrôlées, l'approche suggère une voie pratique vers des modèles plus fiables et physiquement cohérents à partir de mesures limitées, rapprochant la découverte automatique d'équations d'une utilisation courante en laboratoire et en ingénierie.
Citation: Lazebnik, T., Liberzon, A. Moving from table to graph in physics-informed spatio-temporal symbolic regression. Sci Rep 16, 16016 (2026). https://doi.org/10.1038/s41598-026-53882-w
Mots-clés: régression symbolique, réseaux de neurones sur graphes, données spatio-temporelles, découverte d'équations, apprentissage informé par la physique