Clear Sky Science · es

Evaluación comparativa de modelos de aprendizaje automático para la predicción diaria del caudal en una cuenca monzónica subtropical

· Volver al índice

Por qué las previsiones fluviales importan en la vida cotidiana

En las regiones monzónicas, los ríos pueden pasar de la calma a una situación catastrófica en horas, poniendo en riesgo vidas, viviendas y suministros de agua. Predecir con precisión cuánto agua circulará por un río cada día es la base de las alertas de inundación, la gestión de embalses y el abastecimiento urbano. Este estudio se centra en un sistema fluvial subtropical del sur de China y plantea una pregunta práctica de alcance global: entre las herramientas de aprendizaje automático más usadas hoy, ¿cuáles son realmente las mejores para pronosticar el caudal diario, especialmente durante inundaciones peligrosas?

Figure 1
Figure 1.

Un río propenso a tormentas bajo presión

La investigación se centra en la cuenca de Boluo, parte del río Dongjiang que contribuye al suministro de agua del Área de la Gran Bahía de Guangdong–Hong Kong–Macao. La región tiene un clima monzónico típico: la mayor parte de la lluvia cae en unos pocos meses intensos, a menudo traída por frentes y tifones. Además de esta volatilidad natural, un gran embalse y otras actividades humanas modifican la temporalidad y el volumen de los caudales. Los autores recopilaron décadas de datos diarios de pluviómetros, estaciones meteorológicas y aforos en puntos clave del río, y dividieron los registros en años de entrenamiento y años de prueba para imitar la predicción en condiciones reales. Esto les permitió evaluar cómo afrontan los distintos algoritmos un sistema fluvial que es a la vez muy estacional y fuertemente gestionado.

Siete pronosticadores digitales frente a frente

El equipo comparó siete modelos de aprendizaje automático ampliamente usados: una regresión lineal simple, tres tipos de ensamblados basados en árboles (Random Forest, Extra Trees y Gradient Boosting, incluyendo XGBoost), una red neuronal artificial clásica y una red LSTM (Long Short‑Term Memory) más avanzada diseñada para manejar secuencias temporales. Cada modelo se ajustó cuidadosamente con los mismos procedimientos y se evaluó con varias métricas de precisión. En el conjunto de condiciones consideradas, los siete produjeron pronósticos razonablemente buenos, lo que confirma que los enfoques basados en datos son herramientas potentes para la predicción fluvial. Sin embargo, surgieron diferencias claras. El modelo LSTM resultó el mejor, seguido de cerca por la red neuronal convencional, mientras que el modelo lineal simple tuvo un rendimiento sorprendentemente bueno y superó a todos los métodos basados en árboles.

Cómo se comportan los modelos cuando el río ruge

Las inundaciones son donde la predicción realmente cuenta, por lo que los autores se centraron en los días de caudal alto y en tres de los mayores eventos de crecida del registro. En estas condiciones extremas, los contrastes se acentuaron. El LSTM mantuvo su ventaja, siendo el más preciso cuando los caudales superaron el percentil 90, 95 e incluso el 99: días en los que el río es más peligroso. Aun así subestimó algunos picos, pero normalmente por menos del 20 por ciento. La red neuronal estándar rindió de forma razonable, mientras que los modelos basados en árboles a menudo erraron los picos en un 30–50 por ciento y, en los días de caudal más alto, rindieron peor que usar simplemente la media a largo plazo. No obstante, la mayoría de los modelos acertaron el día del pico con una precisión de alrededor de un día, lo cual es crucial para emitir alertas incluso si la altura exacta no se predice con precisión.

Figure 2
Figure 2.

Qué impulsa realmente las subidas y bajadas del río

Para ir más allá de predicciones tipo “caja negra”, el estudio examinó qué entradas eran las más relevantes para los modelos. Varias técnicas, incluida una metodología inspirada en teoría de juegos llamada SHAP, señalaron la misma respuesta: el caudal medido en un aforo aguas arriba llamado Lingxia dominaba los pronósticos. En otras palabras, el nivel del río aguas arriba del día anterior fue por lo general más informativo que las precipitaciones del día. Esto refleja una especie de memoria hidrológica, en la que el río integra los efectos de las tormentas recientes, la humedad del suelo y el agua subterránea en su caudal presente. Cuando los investigadores eliminaron los datos de caudal aguas arriba, la habilidad del LSTM cayó drásticamente; al eliminar los datos de lluvia, el rendimiento apenas cambió. Esto sugiere que, para la predicción diaria en esta cuenca, seguir cuánta agua ya hay en el sistema puede importar más que instalar más pluviómetros.

Qué significan los hallazgos para la seguridad ante inundaciones

Para el público no especializado, la conclusión es clara: los modelos inteligentes que recuerdan las condiciones previas, como las LSTM, pueden ofrecer pronósticos fluviales más fiables que muchas alternativas populares, especialmente cuando se acercan inundaciones. Al mismo tiempo, un modelo simple bien diseñado puede seguir siendo sorprendentemente eficaz, sobre todo cuando hay buenas medidas de caudal aguas arriba. El trabajo subraya que mejorar la predicción de inundaciones no se trata solo de usar algoritmos más sofisticados o más datos de lluvia; se trata de captar la memoria inherente del río y combinar herramientas basadas en datos con comprensión física. Tales avances pueden ayudar a los gestores del agua en regiones monzónicas a tomar decisiones más tempranas y con mayor confianza cuando se aproxima la próxima gran tormenta.

Cita: Zhang, Z., Xiao, Y., Chen, R. et al. Comparative assessment of machine learning models for daily streamflow prediction in a subtropical monsoon watershed. Sci Rep 16, 7341 (2026). https://doi.org/10.1038/s41598-026-38969-8

Palabras clave: predicción de caudal, predicción de inundaciones, aprendizaje automático, redes neuronales LSTM, ríos monzónicos