Clear Sky Science · es

El desarrollo y evaluación de sistemas de preguntas y respuestas agrícolas basados en grandes modelos de lenguaje

· Volver al índice

Respuestas inteligentes para producir alimentos

Los agricultores y expertos agrícolas toman decisiones diarias sobre qué sembrar, cómo regar y cómo proteger los cultivos. Obtener buenos consejos con rapidez puede marcar la diferencia entre una cosecha saludable y un fracaso costoso. Este artículo explora cómo las herramientas modernas de IA denominadas grandes modelos de lenguaje pueden impulsar sistemas de preguntas y respuestas para la agricultura, convirtiendo preguntas en lenguaje natural en orientación práctica para el campo.

Figure 1
Figure 1.

Por qué las explotaciones necesitan mejor ayuda digital

La agricultura se está volviendo cada vez más basada en datos, desde imágenes satelitales hasta sensores de suelo. Sin embargo, muchos expertos y técnicos aún tienen dificultades para acceder a información fiable y fácil de entender cuando la necesitan. Los sistemas de IA tradicionales a menudo requieren enormes conjuntos de datos etiquetados, ordenadores potentes y programadores especializados. En contraste, los grandes modelos de lenguaje—entrenados con vastas colecciones de texto—pueden responder preguntas, resumir información y razonar sobre problemas con muchos menos datos específicos para la tarea. Esto los convierte en herramientas atractivas para agricultores, asesores y servicios de extensión que necesitan apoyo rápido y de bajo coste.

Construyendo una máquina de respuestas agrícolas

Para evaluar cómo pueden funcionar estos modelos en la práctica, los autores crearon un sistema de preguntas y respuestas agrícolas llamado AgriQAs. Reunieron 90 preguntas de opción múltiple de fuentes agrícolas fiables, cubriendo tres áreas: agricultura general, horticultura y producción de cultivos. Cada tema incluyó preguntas fáciles, medias y difíciles, desde definiciones simples hasta problemas que requieren varios pasos de razonamiento. Se probaron dos modelos de lenguaje líderes: uno de OpenAI (GPT‑4o) y otro de Google (Gemini‑2.0‑flash). Para cada pregunta, ambos modelos tuvieron que elegir la opción correcta entre cuatro respuestas, tal como lo haría una persona en un examen.

Enseñar a la IA a razonar sobre problemas agrícolas

Simplemente formular una pregunta a un modelo no siempre produce la mejor respuesta. La forma en que se escribe la pregunta—el “prompt”—puede influir fuertemente en el resultado. Los investigadores compararon cuatro estilos de prompting. En el más simple, llamado Zero‑Shot, al modelo solo se le daba la pregunta y se le pedía que eligiera una opción. En Chain‑of‑Thought se le solicitó que mostrara razonamiento paso a paso. Self‑Consistency hizo que el modelo generara varias líneas de razonamiento y luego eligiera la respuesta más consistente. Tree‑of‑Thought lo animó a explorar varias rutas de solución antes de decidir. El equipo también utilizó una herramienta automática de ingeniería de prompts para refinar el texto de las instrucciones, reforzando el “rol” del modelo como experto agrícola y clarificando cómo debía razonar.

Figure 2
Figure 2.

¿Qué tan bien se desempeñaron los asesores de IA?

En todas las preguntas, ambos modelos se comportaron sorprendentemente bien, pero el desempeño dependió mucho de cómo se les indicó. GPT‑4o alcanzó una precisión de entre aproximadamente el 85 % y el 95 %, mientras que Gemini‑2.0‑flash osciló entre aproximadamente el 75 % y el 88 %. Los resultados más débiles para ambos provinieron del estilo Zero‑Shot, que ofrece poca guía sobre cómo razonar. Los mejores resultados se obtuvieron con razonamientos más estructurados: Self‑Consistency dio a GPT‑4o sus mejores puntuaciones, y Tree‑of‑Thought funcionó mejor para Gemini‑2.0‑flash. Los errores fueron más comunes en las preguntas más difíciles y en la categoría de producción de cultivos, que con frecuencia requiere decisiones detalladas y en varios pasos. Los autores fueron más allá de los promedios simples, usando pruebas estadísticas formales para confirmar que las diferencias entre métodos de prompting y modelos eran reales y no debidas al azar.

Qué significa esto para la agricultura del futuro

Para los no especialistas, el mensaje clave es que “cómo preguntas” importa casi tanto como “a quién preguntas” cuando trabajas con IA. Con prompts cuidadosamente diseñados, los grandes modelos de lenguaje pueden servir como asistentes potentes para ingenieros agrícolas y técnicos, ofreciendo asesoramiento rápido y razonablemente preciso sin necesidad de entrenamiento personalizado para cada nuevo problema. Los autores enfatizan, sin embargo, que estos sistemas deben usarse con responsabilidad: respuestas sesgadas o incorrectas podrían inducir a error a los agricultores y causar pérdidas económicas. A medida que trabajos futuros incorporen datos regionales, información de sensores y una guía más clara de expertos humanos, herramientas como AgriQAs podrían convertirse en compañeros cotidianos en una agricultura sostenible y de alta tecnología—ayudando a los productores a tomar mejores decisiones mientras conservan recursos.

Cita: Eldem, A., Eldem, H. The development and evaluation of agricultural question-answering systems based on large language models. Sci Rep 16, 5357 (2026). https://doi.org/10.1038/s41598-026-35003-9

Palabras clave: IA agrícola, preguntas y respuestas, grandes modelos de lenguaje, ingeniería de prompts, agricultura digital