Clear Sky Science · es

Cosechando conocimientos: aprendizaje automático interpretable para entender los factores ambientales que afectan el rendimiento de maíz y soja en EE. UU.

· Volver al índice

Por qué importa esto para lo que hay en nuestro plato

El maíz y la soja son los pilares de la agricultura en EE. UU., alimentando a personas y ganado dentro y fuera del país. A medida que el clima se vuelve menos predecible, agricultores y científicos se apresuran a comprender cómo las olas de calor, los cambios en las precipitaciones y las condiciones del suelo afectarán las cosechas. Este estudio muestra cómo herramientas modernas de aprendizaje automático, hechas más transparentes e interpretable, pueden cribar montañas de datos agrícolas y ambientales para revelar qué factores meteorológicos y del paisaje influyen con mayor fuerza en los rendimientos de maíz y soja en las principales regiones de cultivo de EE. UU.

Figure 1
Figure 1.

Observando de cerca campos reales

En lugar de confiar en promedios por condado, los investigadores utilizaron datos detallados de “monitores de rendimiento” recogidos por las cosechadoras mientras cosechaban 134 campos de maíz y soja en nueve estados de EE. UU. entre 2007 y 2021. Cada campo se dividió en una malla fina del tamaño aproximado de un pequeño lote urbano, capturando cómo variaba el rendimiento de un parche a otro. Vincularon cada celda de la malla con mapas públicos de clima diario, propiedades del suelo y características del terreno como pendiente y elevación. Tras depurar errores, eliminar valores atípicos y alinear todo a una resolución común de 30 metros, ensamblaron un gran conjunto de datos que describe cómo se desempeñó cada pequeña porción de tierra bajo su combinación única de condiciones.

Enseñando a las máquinas a predecir las cosechas

Con este conjunto de datos enriquecido, el equipo probó varios enfoques de aprendizaje automático, incluidos métodos modernos basados en árboles y redes neuronales, para ver cuáles podían predecir mejor el rendimiento solo a partir de entradas ambientales. Empleando herramientas automatizadas para seleccionar los mejores modelos y las variables más informativas, alcanzaron alta precisión: para el maíz, el modelo final explicó alrededor del 87% de la variación del rendimiento; para la soja, aproximadamente el 90%. Estos modelos funcionaron bien no solo en conjunto, sino también cuando se evaluaron por separado por año y por estado, lo que sugiere que las relaciones aprendidas se generalizan a través de distintas temporadas y regiones en lugar de memorizar simplemente los datos de entrenamiento. Pruebas espaciales de los errores residuales mostraron que la mayoría de los patrones generales fueron capturados, quedando solo cierta variación fina sin explicar dentro de los campos.

Figure 2
Figure 2.

Qué es lo que realmente impulsa los rendimientos de maíz y soja

Para abrir la “caja negra” del aprendizaje automático, los autores emplearon herramientas modernas de interpretación conocidas como valores SHAP y la importancia por permutación. Estas técnicas revelan qué entradas son las más relevantes y cómo empujan las predicciones hacia arriba o hacia abajo. En el caso del maíz, el clima dominó claramente: las temperaturas máximas diarias durante la estación de crecimiento, la radiación solar y la variabilidad diaria de las precipitaciones estuvieron entre los principales predictores. El modelo indicó un punto de inflexión pronunciado: cuando las temperaturas máximas diarias superaban aproximadamente los 36–38 °C (unos 97–100 °F), los rendimientos previstos de maíz comenzaban a caer en picado, en consonancia con evidencia experimental de estrés por calor en etapas de crecimiento sensibles. En contraste, el modelo de soja se apoyó más en características del terreno y del suelo, como pendiente, elevación y medidas relacionadas con la capacidad del suelo para almacenar agua, con las precipitaciones de inicios de verano desempeñando un papel de apoyo. En conjunto, estas señales sugieren que el rendimiento del maíz es especialmente vulnerable a extremos de calor y oscilaciones climáticas, mientras que el rendimiento de la soja está más estrechamente ligado a cómo el agua se mueve y se almacena en el paisaje.

De los patrones a la mejora genética y las decisiones en la explotación

Al identificar qué tensiones ambientales afectan más a los rendimientos, este trabajo ofrece orientación práctica tanto a mejoradores de plantas como a gestores de explotaciones. Para el maíz, el umbral de calor identificado subraya la necesidad de variedades capaces de mantener la cuaja del grano durante episodios cortos pero intensos de calor, así como de estrategias de manejo como riego o fechas de siembra ajustadas en regiones propensas a temperaturas extremas. Para la soja, la fuerte influencia del terreno y el suelo apunta hacia la mejora genética para mayor tolerancia a la sequía y al encharcamiento, y hacia decisiones a nivel de campo que trabajen con el flujo natural del agua, como drenajes selectivos o prácticas de conservación que mejoren la estructura del suelo. Aunque los modelos siguen siendo correlacionales y no pueden sustituir a experimentos controlados, demuestran cómo el aprendizaje automático interpretable, combinado con mapas ambientales de amplia disponibilidad y datos de campo, puede revelar puntos de estrés ocultos en nuestro sistema alimentario y ayudar a hacer la producción agrícola de EE. UU. más resiliente en un clima más cálido y menos predecible.

Cita: Smith, H.W., Heffernan, C.J., Ashworth, A.J. et al. Harvesting insights: interpretable machine learning to understand environmental drivers of U.S. maize and soybean yield. Sci Rep 16, 8994 (2026). https://doi.org/10.1038/s41598-026-38724-z

Palabras clave: predicción del rendimiento de cultivos, maíz, soja, aprendizaje automático, impactos climáticos