Clear Sky Science · es

Una evaluación comparativa de algoritmos de optimización basados en gradiente para el pronóstico de carga a corto plazo usando redes residuales profundas

· Volver al índice

Por qué importa hoy el consumo eléctrico de mañana

Cada vez que encendemos una luz o conectamos un dispositivo, las compañías eléctricas deben tener ya electricidad disponible para satisfacer esa demanda. Adivinar la demanda de mañana unas horas o un día antes ayuda a los operadores de la red a mantener las luces encendidas, evitar apagones y ahorrar dinero. Este artículo explora cómo las herramientas modernas de inteligencia artificial pueden hacer que esos pronósticos de demanda a corto plazo sean más precisos y más estables, y muestra que la elección del método de entrenamiento, a menudo pasada por alto, puede importar tanto como el propio modelo.

Adaptarse a una red en cambio

La demanda eléctrica sube y baja con la hora del día, la estación, los días festivos y el clima. Los métodos estadísticos tradicionales tienen dificultades con estos patrones complejos, especialmente cuando intervienen muchas señales distintas. Los modelos de aprendizaje profundo, que apilan muchas capas de cálculos simples, se han vuelto populares porque pueden aprender relaciones no lineales y sutiles. Entre ellos, un diseño llamado red residual profunda añade conexiones “directas” entre capas, lo que facilita entrenar modelos muy profundos y mejora la captura de dependencias a largo plazo en datos como las cargas eléctricas.

Figure 1. Cómo el clima y la demanda pasada fluyen hacia un modelo profundo para producir un pronóstico estable del consumo eléctrico de mañana.
Figure 1. Cómo el clima y la demanda pasada fluyen hacia un modelo profundo para producir un pronóstico estable del consumo eléctrico de mañana.

Dos variantes con sensibilidad al clima

Los autores se centran en dos modelos residuales profundos estrechamente relacionados para el pronóstico de carga a corto plazo. El primero usa el consumo eléctrico pasado, información temporal (como la hora y el día de la semana) y la temperatura para predecir las próximas 24 horas de demanda. El segundo modelo añade muchas más variables meteorológicas de una ciudad tropical, incluyendo precipitación y viento, pero las comprime en un conjunto pequeño de señales combinadas mediante una herramienta estadística estándar que conserva la mayor parte de la variación a la vez que reduce la redundancia. Esto permite que una imagen meteorológica más rica informe a la red sin volverla inmanejable ni más difícil de entrenar.

Cómo las decisiones de entrenamiento moldean el aprendizaje

La mayoría de los estudios que usan estas redes residuales profundas para pronósticos energéticos seleccionan discretamente un método de entrenamiento popular llamado Adam y lo dejan así. Aquí, “método de entrenamiento” significa la receta matemática que ajusta gradualmente los parámetros internos del modelo mientras aprende de datos pasados. Este artículo cuestiona esa costumbre comparando sistemáticamente trece algoritmos de entrenamiento basados en gradiente distintos, incluidos enfoques clásicos y varias variantes adaptativas modernas, todos dentro de la misma arquitectura de modelo. Los autores los prueban en dos conjuntos de datos reales: uno del sistema eléctrico templado de Nueva Inglaterra en Estados Unidos y otro de Malasia, en un clima tropical.

Figure 2. Diferentes caminos de entrenamiento guían a un modelo profundo a través de un paisaje hacia pronósticos de demanda eléctrica ligeramente distintos pero con bajo error.
Figure 2. Diferentes caminos de entrenamiento guían a un modelo profundo a través de un paisaje hacia pronósticos de demanda eléctrica ligeramente distintos pero con bajo error.

Qué funcionó mejor en distintos climas

En ambas regiones, los métodos que adaptan sus pasos de aprendizaje usando patrones recientes de error generalmente superaron a los enfoques más antiguos y sencillos. Para el modelo original que depende principalmente de la temperatura como señal meteorológica, una variante llamada AMSGrad consiguió los errores de pronóstico promedio más bajos y el comportamiento de entrenamiento más estable en ambos climas. Sin embargo, al cambiar al modelo con clima multi-variable comprimido, el equilibrio cambió. Con este nuevo diseño de entrada, otro método adaptativo, AdaBelief, se adelantó, y Adam también rindió de forma sólida. En otras palabras, modificar cómo se empaqueta la información meteorológica para el modelo reconfiguró sutilmente el paisaje de aprendizaje y favoreció reglas de entrenamiento diferentes.

Verificar que las mejoras son reales y no azarosas

Para asegurarse de que las mejoras observadas no fuesen solo ruido estadístico, los autores emplearon una técnica de remuestreo que reproduce repetidamente la tarea de pronóstico sobre muestras de datos ligeramente variadas. Esto les permitió estimar cuán probable es que un método de entrenamiento supere verdaderamente a otro. Las pruebas mostraron que varias de las mejoras observadas, como AMSGrad superando a Adam en los datos de Nueva Inglaterra y los beneficios del enfoque de clima comprimido con ciertos optimizadores en Malasia, son poco probables de deberse únicamente al azar.

Qué significa esto para la red del futuro

Para no especialistas, el mensaje principal es que mejorar los pronósticos de demanda eléctrica no depende solo de inventar nuevas redes neuronales o de introducir más datos meteorológicos en ellas. La forma en que esas redes se entrenan y la manera en que se destilan las entradas meteorológicas pueden cambiar significativamente la precisión y la estabilidad. Al demostrar que algunas reglas de entrenamiento adaptativas mejoran el rendimiento de forma consistente, y que la mejor opción puede depender de cómo se representa la entrada, este estudio ofrece a planificadores de red y a practicantes de IA una guía más clara para construir herramientas de pronóstico más fiables que ayuden a mantener los sistemas eléctricos seguros y económicos.

Cita: Liu, J., Ahmad, F.A., Samsudin, K. et al. A comparative evaluation of gradient-based optimization algorithms for short-term load forecasting using deep residual networks. Sci Rep 16, 14949 (2026). https://doi.org/10.1038/s41598-026-45829-y

Palabras clave: pronóstico de carga a corto plazo, redes residuales profundas, algoritmos de optimización, pronóstico en sistemas eléctricos, características meteorológicas