Clear Sky Science · es
Modelado bidireccional del espacio de estados para una detección ligera y robusta de espigas de trigo en entornos agrícolas complejos
Por qué contar espigas de trigo desde el cielo importa
Alimentar a un mundo en crecimiento depende de conocer cuánto pueden producir nuestros campos, y una pista clave proviene de las espigas de trigo, las puntas portadoras de grano de cada planta. Agricultores y mejoradores han contado estas espigas a mano durante mucho tiempo para estimar el rendimiento, pero hacerlo a lo largo de grandes extensiones es lento, costoso y propenso a errores. Este estudio presenta un nuevo sistema de visión por computador, Mamba-WheatNet, que utiliza imágenes de drones para detectar y contar automáticamente las espigas en tiempo real, incluso cuando los campos están desordenados, saturados y con iluminación cambiante.
Ojos inteligentes sobre campos agrícolas complejos
Los campos reales están lejos de ser ordenados. Las espigas pueden quedar ocultas por hojas, solaparse entre sí o mezclarse con malas hierbas y suelo descubierto, y su color y forma cambian a medida que crecen. Métodos anteriores intentaron basarse en rasgos simples como color o textura, pero estos fallan cuando cambia la iluminación o la fase de crecimiento. El aprendizaje profundo ha mejorado la situación al permitir que las redes neuronales aprendan patrones directamente de muchas imágenes. Sin embargo, muchos modelos existentes aún tienen dificultades con escenas saturadas y con frecuencia requieren gran potencia de cómputo, difícil de ejecutar en drones o dispositivos de campo pequeños.

Un modelo más ligero que se centra en lo importante
Mamba-WheatNet está diseñado para afrontar estos retos manteniéndose lo suficientemente ligero para un uso práctico en el campo. Combina dos ideas principales: capas convolucionales eficientes, adecuadas para capturar detalles locales, y una familia más reciente de modelos conocidos como espacios de estado selectivos, que son mejores para seguir patrones de largo alcance. Los autores construyen un extractor de características que primero descompone las imágenes en patrones multiescala y luego las pasa por una etapa de fusión especial que inspecciona toda la escena. Esto ayuda al sistema a ignorar el ruido de fondo, como hojas superpuestas o tierra, y a prestar mayor atención a las formas y matices sutiles que identifican cada espiga.
Cómo el modelo desenreda espigas densas
Dentro de Mamba-WheatNet, dos bloques personalizados realizan gran parte del trabajo pesado. Uno, llamado Bloque Residual Depthwise Separable (separable en profundidad y por canal residual), usa convoluciones ligeras divididas por canales para capturar detalles finos sin aumentar en exceso las operaciones computacionales. El otro, el Bloque de Escaneo Espacial Bidireccional, recorre mapas de características horizontal y verticalmente, reuniendo contexto en ambas direcciones mientras enfatiza selectivamente los canales más informativos. Estos componentes se combinan en una unidad de fusión mayor que mezcla señales locales y globales, lo que facilita separar espigas tocándose o solapadas y mantener la precisión cuando las espigas son pequeñas o están muy agrupadas en imágenes aéreas.

Poniendo el sistema a prueba
Para evaluar su enfoque en condiciones realistas, los investigadores entrenaron y probaron Mamba-WheatNet en GWHD-2021, una amplia colección pública de imágenes por dron de campos de trigo que abarca muchas variedades, disposiciones de siembra y estados de crecimiento. Compararon su sistema con varios detectores de objetos punteros, incluidos los modelos YOLO más recientes y redes basadas en transformadores. Mamba-WheatNet alcanzó mayor precisión y exhaustividad y puntuaciones de detección global ligeramente superiores mientras utilizaba una potencia de cómputo moderada y funcionaba lo bastante rápido para un uso casi en tiempo real. El equipo también comprobó la transferibilidad del modelo a otro conjunto de datos de drones, VisDrone2019, que contiene muchos tipos de objetos pequeños en escenas urbanas concurridas. Allí también, el modelo ofreció la mejor precisión entre los detectores compactos probados, demostrando que su diseño se generaliza más allá del trigo.
Qué significa esto para la agricultura inteligente futura
El estudio concluye que Mamba-WheatNet ofrece una forma práctica y precisa de contar espigas desde el aire, incluso cuando los campos son visualmente complejos. Al combinar cuidadosamente capas ligeras y eficientes con un mecanismo de escaneo global, el modelo sigue patrones sutiles sin sobrecargar el hardware que suelen llevar los drones o robots de campo. Para agricultores, mejoradores y agrónomos, esto podría traducirse en estimaciones de rendimiento más rápidas y fiables y un mejor seguimiento de la salud de los cultivos a lo largo del tiempo, ayudando a avanzar hacia una gestión agrícola más basada en datos y de mayor precisión.
Cita: Deng, G., Li, Z. & Gao, Z. Bidirectional state space modeling for lightweight and robust wheat head detection in complex agricultural environments. Sci Rep 16, 14895 (2026). https://doi.org/10.1038/s41598-026-45083-2
Palabras clave: detección de espigas de trigo, imágenes por dron, aprendizaje profundo, agricultura de precisión, detección de objetos