Clear Sky Science · ru

Переход от таблицы к графу в физически информированной спатио-временной символической регрессии

· Назад к списку

Обучение компьютеров раскрывать скрытые законы природы

Большая часть науки сводится к поиску простых правил, объясняющих, как мир меняется со временем — от маятника до распространения тепла по металлическому стержню. В этой статье рассматривается новый подход, помогающий компьютерам заново открывать такие законы непосредственно из данных, обращая внимание не только на сами числа, но и на то, где и когда они были измерены. Работа показывает, как объединение двух представлений данных — привычной табличной формы и сетевой — делает автоматическое обнаружение уравнений точнее, более устойчивым к шуму и ближе к реальной физике.

От таблиц чисел к сетям связей

Большинство современных инструментов для автоматического открытия уравнений рассматривают данные как простую таблицу, где каждая строка — независимое измерение. Такая постановка годится для простых задач, но испытывает трудности с реальными физическими системами, которые развиваются и в пространстве, и во времени. Показание температуры в одной точке зависит от соседей и от того, что произошло немного ранее. Игнорирование этих связей может привести к тому, что компьютеры выведут формулы, хорошо аппроксимирующие данные, но упускающие реальный основной закон. Авторы утверждают, что чтобы уважать природный порядок, требуется представление, отслеживающее, какие измерения являются соседними в пространстве и времени, а не только их числовые значения.

Figure 1. Как связывание точек данных в пространстве и времени помогает выявить простые законы, лежащие в основе сложного физического поведения.
Figure 1. Как связывание точек данных в пространстве и времени помогает выявить простые законы, лежащие в основе сложного физического поведения.

Преобразование измерений в пространственно-временную сеть

Чтобы исправить это, исследование вводит двойное представление данных. Первый вид — привычная таблица чисел. Второй вид — граф, сеть, узлы которой соответствуют измерениям в конкретных местах и моментах времени, а ребра связывают показания, близкие по пространству или времени. Этот граф служит картой локальных причин и следствий: различия вдоль пространственных ребер отражают пространственные изменения, а различия вдоль временных ребер имитируют скорости изменения во времени. Графовая нейронная сеть затем обрабатывает эту структуру, извлекая сжатые, с учётом физики признаки, которые подчёркивают сглаженные, согласованные закономерности и подавляют случайный шум.

Обучение искателей уравнений «прислушиваться» к физике

Когда эти выученные признаки становятся доступными, их подают на вход инструментам символической регрессии, которые ищут читаемые человеком уравнения, описывающие данные. Ключевое новшество — новая цель обучения, оценивающая кандидатов в уравнения по двум критериям одновременно. Во-первых, проверяется, насколько хорошо смоделированные данные от кандидата соответствуют исходным измерениям. Во-вторых, проверяется, попадает ли смоделированные данные, пройдя через графовую нейронную сеть, в то же «латентное» пространство, что и реальные данные. Вторая проверка заставляет обнаруженные уравнения уважать пространственно-временные взаимосвязи, зафиксированные в графе, сдвигая поиск в сторону формул, которые не просто аппроксимируют числа, но сохраняют известную физическую структуру.

Figure 2. Как пространственно-временная сеть измерений направляет модель к поэтапному восстановлению базового дифференциального уравнения.
Figure 2. Как пространственно-временная сеть измерений направляет модель к поэтапному восстановлению базового дифференциального уравнения.

Испытание метода

Чтобы оценить эффективность идеи, авторы сгенерировали синтетические данные по десяти классическим уравнениям из физики и инженерии, включая законы для пружин, теплопроводности, жидкоподобного движения и систем с запаздывающей реакцией. Для каждого случая они добавляли отвлекающие сигналы и контролируемые уровни шума, затем запускали десять разных методов поиска уравнений с новым графовым представлением и без него. Во всех случаях использование двойного представления привело к скромным, но последовательным улучшениям точности, лучшему восстановлению корректной символической формы и более строгому соблюдению физических ограничений. Наибольший выигрыш наблюдался при шумных или скудных данных — условиях, часто встречающихся в реальных экспериментах.

Что это значит для будущих научных открытий

Проще говоря, статья показывает: предоставление компьютерам не только чисел, но и схемы того, как эти числа связаны в пространстве и времени, помогает им надёжнее угадывать правильные уравнения. Вплетая сетевое представление в обычные инструменты для открытия уравнений, метод повышает устойчивость без изменения внутренней логики этих инструментов. Хотя тесты были проведены на тщательно контролируемых моделируемых данных, подход намечает практический путь к более надёжным, физически согласованным моделям при ограниченных измерениях, приближая автоматическое открытие уравнений к повседневному использованию в лабораториях и инженерной практике.

Цитирование: Lazebnik, T., Liberzon, A. Moving from table to graph in physics-informed spatio-temporal symbolic regression. Sci Rep 16, 16016 (2026). https://doi.org/10.1038/s41598-026-53882-w

Ключевые слова: символическая регрессия, графовые нейронные сети, спатио-временные данные, открытие уравнений, физически информированное обучение