Clear Sky Science · es

Pasar de la tabla al grafo en regresión simbólica espaciotemporal informada por la física

2026-05-23 · Volver al índice

Enseñar a los ordenadores a descubrir reglas ocultas de la naturaleza

Gran parte de la ciencia consiste en encontrar reglas sencillas que expliquen cómo cambia el mundo con el tiempo, desde un péndulo oscilante hasta el calor que se propaga por una barra de metal. Este artículo explora una nueva forma de ayudar a los ordenadores a redescubrir tales reglas directamente a partir de datos, prestando atención no solo a los números en sí, sino también a dónde y cuándo se midieron. El trabajo muestra cómo combinar dos vistas de los datos —la tradicional vista tipo hoja de cálculo y una vista en forma de red— puede hacer que el descubrimiento automático de ecuaciones sea más preciso, más robusto frente al ruido y más fiel a la física real.

De hojas de cálculo de números a redes de conexiones

La mayoría de las herramientas actuales para el descubrimiento automático de ecuaciones tratan los datos como una simple tabla, donde cada fila es una medición independiente. Ese planteamiento funciona para problemas simples pero se queda corto con sistemas físicos reales, que evolucionan tanto en el espacio como en el tiempo. Una lectura de temperatura en un punto depende de sus vecinos y de lo que ocurrió un instante antes. Ignorar estos vínculos puede llevar a que los ordenadores generen fórmulas que ajustan los datos pero no capturan la ley subyacente. Los autores sostienen que, para respetar cómo funciona la naturaleza, necesitamos una representación que registre qué mediciones son vecinas en espacio y tiempo, no solo sus valores brutos.

Figure 1. Cómo enlazar puntos de datos en espacio y tiempo ayuda a revelar las reglas sencillas detrás de comportamientos físicos complejos.

Convertir las mediciones en una red espaciotemporal

Para resolver esto, el estudio presenta una representación dual de los datos. La primera vista es la conocida tabla de números. La segunda vista es un grafo, una red cuyos nodos corresponden a mediciones tomadas en ubicaciones y tiempos específicos, mientras que las aristas enlazan lecturas que están próximas en el espacio o en el tiempo. Este grafo actúa como un mapa de causa y efecto locales, donde las diferencias a lo largo de aristas espaciales reflejan cambios espaciales y las diferencias a lo largo de aristas temporales imitan tasas de cambio en el tiempo. Una red neuronal basada en grafos procesa entonces esta estructura para aprender características comprimidas y conscientes de la física que resaltan patrones suaves y consistentes y atenúan el ruido aleatorio.

Enseñar a los buscadores de ecuaciones a escuchar a la física

Una vez disponibles estas características aprendidas, se conectan a herramientas de regresión simbólica, que buscan ecuaciones legibles por humanos que describan los datos. La innovación clave es un nuevo objetivo de entrenamiento que evalúa las ecuaciones candidatas de dos maneras a la vez. Primero, comprueba qué tan bien los datos simulados a partir de una candidata coinciden con las mediciones originales. Segundo, verifica si los datos simulados, tras pasar por la red neuronal de grafos, caen en el mismo espacio “latente” que los datos reales. Esta segunda comprobación obliga a que las ecuaciones descubiertas respeten las relaciones espaciales y temporales capturadas por el grafo, desviando la búsqueda de fórmulas que ajustan los números pero rompen la estructura física conocida.

Figure 2. Cómo una red espaciotemporal de mediciones guía a un modelo para recuperar paso a paso la ecuación diferencial subyacente.

Probar el método

Para evaluar el rendimiento de la idea, los autores generaron datos sintéticos a partir de diez ecuaciones clásicas de la física y la ingeniería, incluidas leyes para muelles, flujo de calor, movimientos tipo fluido y sistemas con respuestas retardadas. Para cada caso añadieron señales distractoras y cantidades controladas de ruido, y luego ejecutaron diez métodos distintos de búsqueda de ecuaciones con y sin la nueva representación basada en grafos. En todos los casos, usar la vista dual condujo a mejoras modestas pero consistentes en la precisión, mejor recuperación de la forma simbólica correcta y mayor adherencia a las restricciones físicas. Los beneficios fueron más evidentes cuando los datos eran ruidosos o escasos, condiciones que a menudo se encuentran en experimentos reales.

Qué implica esto para el descubrimiento científico futuro

En términos sencillos, el artículo muestra que dar a los ordenadores no solo los números, sino también un esbozo de cómo esos números se relacionan en espacio y tiempo, les ayuda a adivinar las ecuaciones correctas con más fiabilidad. Al entretejer una vista en red en herramientas estándar de descubrimiento de ecuaciones, el método mejora la robustez sin cambiar el funcionamiento interno de esas herramientas. Aunque las pruebas aquí usan datos simulados cuidadosamente controlados, el enfoque sugiere un camino práctico hacia modelos más confiables y físicamente consistentes a partir de mediciones limitadas, acercando el descubrimiento automático de ecuaciones a un uso cotidiano en laboratorios y en la práctica de la ingeniería.

Cita: Lazebnik, T., Liberzon, A. Moving from table to graph in physics-informed spatio-temporal symbolic regression. Sci Rep 16, 16016 (2026). https://doi.org/10.1038/s41598-026-53882-w

Palabras clave: regresión simbólica, redes neuronales de grafos, datos espaciotemporales, descubrimiento de ecuaciones, aprendizaje informado por la física