Clear Sky Science · pt

Modelagem bidirecional de espaço de estados para detecção leve e robusta de espigas de trigo em ambientes agrícolas complexos

· Voltar ao índice

Por que contar espigas de trigo a partir do céu é importante

Alimentar um mundo em crescimento depende de saber quanto nossos campos podem produzir, e uma pista-chave vem das espigas de trigo, as pontas reprodutivas de cada planta. Agricultores e melhoristas há muito contam essas espigas manualmente para estimar a produtividade, mas fazer isso em campos extensos é lento, caro e sujeito a erro. Este estudo apresenta um novo sistema de visão computacional, o Mamba-WheatNet, que usa imagens de drones para identificar e contar automaticamente espigas de trigo em tempo real, mesmo quando os campos estão bagunçados, lotados e iluminados por luz solar variável.

Olhos inteligentes sobre campos agrícolas complexos

Campos reais estão longe de ser arrumados. Espigas de trigo podem ficar ocultas por folhas, sobrepostas entre si ou misturadas com plantas daninhas e solo exposto, e sua cor e forma mudam conforme crescem. Métodos anteriores tentaram se basear em características simples como cor ou textura, mas esses critérios falham quando a iluminação ou o estágio de crescimento muda. O deep learning melhorou a situação permitindo que redes neurais aprendam padrões diretamente a partir de muitas imagens. No entanto, muitos modelos existentes ainda têm dificuldades com cenas poluídas e frequentemente exigem grande poder computacional, difícil de executar em drones ou pequenos dispositivos de campo.

Figure 1. Imagens de drone de campos de trigo alimentam um modelo inteligente que destaca e conta espigas de trigo para estimativa de produtividade.
Figure 1. Imagens de drone de campos de trigo alimentam um modelo inteligente que destaca e conta espigas de trigo para estimativa de produtividade.

Um modelo mais leve que foca no que importa

O Mamba-WheatNet foi projetado para enfrentar esses desafios mantendo-se leve o suficiente para uso prático na fazenda. Ele combina duas ideias principais: camadas convolucionais eficientes, que são boas em capturar detalhes locais, e uma família mais nova de modelos conhecida como espaços de estado seletivos, melhores em acompanhar padrões de longo alcance. Os autores constroem um extrator de características que primeiro decompõe as imagens em padrões multiescala e depois os passa por uma etapa especial de fusão que observa toda a cena. Isso ajuda o sistema a ignorar o ruído de fundo, como folhas sobrepostas ou solo, e prestar mais atenção às formas e tonalidades sutis que marcam espigas individuais.

Como o modelo desenreda espigas densas

Dentro do Mamba-WheatNet, dois blocos personalizados fazem grande parte do trabalho pesado. Um, chamado Bloco Residual Depthwise Separable, usa convoluções leves divididas por canais para capturar detalhes finos sem aumentar muito o número de operações. O outro, o Bloco de Varredura Espacial Bidirecional, varre mapas de características horizontal e verticalmente, reunindo contexto em ambas as direções enquanto enfatiza seletivamente os canais mais informativos. Esses componentes são combinados em uma unidade de fusão maior que mistura pistas locais e globais, facilitando separar espigas que se tocam ou se sobrepõem e manter a precisão quando as espigas são pequenas ou muito densas em imagens aéreas.

Figure 2. Um processo passo a passo mostra cenas de trigo confusas sendo transformadas em espigas distintas e limpas à medida que o modelo filtra o ruído de fundo.
Figure 2. Um processo passo a passo mostra cenas de trigo confusas sendo transformadas em espigas distintas e limpas à medida que o modelo filtra o ruído de fundo.

Testando o sistema

Para avaliar o desempenho em condições realistas, os pesquisadores treinaram e testaram o Mamba-WheatNet no GWHD-2021, uma grande coleção pública de imagens de drone de campos de trigo que cobre muitas variedades, arranjos de plantio e estágios de crescimento. Eles compararam seu sistema com vários detectores de objeto líderes, incluindo os modelos YOLO mais recentes e redes baseadas em transformers. O Mamba-WheatNet alcançou maior precisão e recall e resultados gerais de detecção ligeiramente melhores, usando poder computacional modesto e rodando rápido o suficiente para uso quase em tempo real. A equipe também verificou quão bem o modelo se transfere para um conjunto de dados de drone diferente, o VisDrone2019, que contém muitos tipos de pequenos objetos em cenas urbanas lotadas. Ali também o modelo apresentou a melhor acurácia entre os detectores compactos testados, mostrando que seu desenho generaliza além do trigo.

O que isso significa para a agricultura inteligente do futuro

O estudo conclui que o Mamba-WheatNet oferece uma forma prática e precisa de contar espigas de trigo a partir do ar, mesmo quando os campos são visualmente complexos. Ao combinar cuidadosamente camadas leves e eficientes com um mecanismo de varredura global, o modelo acompanha padrões sutis sem sobrecarregar o hardware tipicamente encontrado em drones ou robôs de campo. Para agricultores, melhoristas e agrônomos, isso pode significar estimativas de produtividade mais rápidas e confiáveis e melhor monitoramento da saúde das culturas ao longo do tempo, ajudando a mover a agricultura rumo a um manejo mais orientado por dados e preciso.

Citação: Deng, G., Li, Z. & Gao, Z. Bidirectional state space modeling for lightweight and robust wheat head detection in complex agricultural environments. Sci Rep 16, 14895 (2026). https://doi.org/10.1038/s41598-026-45083-2

Palavras-chave: detecção de espigas de trigo, imagens de drone, deep learning, agricultura de precisão, detecção de objetos