Clear Sky Science · nl

Bidirectionele toestandsruimtemodellering voor lichtgewicht en robuuste detectie van tarwekronen in complexe landbouwomgevingen

· Terug naar het overzicht

Waarom het tellen van tarwekronen vanuit de lucht ertoe doet

Het voeden van een groeiende wereld hangt af van het weten hoeveel voedsel onze velden kunnen opleveren, en een belangrijke aanwijzing komt van de tarwekronen, de graandragende toppen van elke plant. Boeren en veredelaars telden deze lange tijd met de hand om de opbrengst te schatten, maar dat is over grote velden traag, kostbaar en foutgevoelig. Deze studie introduceert een nieuw computervisiestelsel, Mamba-WheatNet, dat beelden van drones gebruikt om tarwekronen automatisch in realtime te signaleren en te tellen, zelfs wanneer velden rommelig, dichtbevolkt en belicht door wisselend zonlicht zijn.

Slimme ogen boven complexe landbouwpercelen

Werkelijke velden zijn allesbehalve ordelijk. Tarwekronen kunnen door bladeren worden verborgen, over elkaar heen liggen of vermengd zijn met onkruid en kale grond, en hun kleur en vorm veranderen tijdens de groei. Eerdere methoden probeerden te leunen op simpele kenmerken zoals kleur of textuur, maar die falen wanneer licht of groeistadium verandert. Deep learning heeft de situatie verbeterd doordat neurale netwerken patronen rechtstreeks uit veel beelden kunnen leren. Toch worstelen veel bestaande modellen nog steeds met drukke scènes en vereisen ze vaak zware rekenkracht die moeilijk te draaien is op drones of kleine veldapparaten.

Figure 1. Dronebeelden van tarwevelden worden in een slim model gevoed dat tarwekronen markeert en telt voor opbrengstschatting.
Figure 1. Dronebeelden van tarwevelden worden in een slim model gevoed dat tarwekronen markeert en telt voor opbrengstschatting.

Een lichter model dat zich op het essentiële richt

Mamba-WheatNet is ontworpen om deze uitdagingen aan te pakken terwijl het licht genoeg blijft voor praktisch gebruik op de boerderij. Het combineert twee hoofdideeën: efficiënte convolutionele lagen, die goed zijn in het vastleggen van lokale details, en een nieuwere modelfamilie die bekendstaat als selectieve toestandsruimten, die beter zijn in het volgen van patronen op lange afstand. De auteurs bouwen een feature-extractor die beelden eerst opsplitst in multiscale-patronen en deze vervolgens door een speciale fusiefase stuurt die over het hele beeld kijkt. Dit helpt het systeem achtergrondruis te negeren, zoals overlappende bladeren of grond, en meer aandacht te schenken aan subtiele vormen en tinten die individuele tarwekronen markeren.

Hoe het model dichte tarwekronen ontrafelt

Binnen Mamba-WheatNet doen twee aangepaste bouwblokken het meeste zware werk. Het ene, het Residual Depthwise Separable Block genoemd, gebruikt lichtgewicht convoluties verdeeld over kanalen om fijne details vast te leggen zonder het aantal berekeningen te doen exploderen. Het andere, het Bidirectional Spatial Scanning Block, scant featuremaps horizontaal en verticaal, verzamelt context in beide richtingen en benadrukt selectief de meest informatieve kanalen. Deze componenten worden gecombineerd in een grotere fusie-eenheid die lokale en globale aanwijzingen mengt, waardoor het eenvoudiger wordt om aangrenzende of overlappende tarwekronen te scheiden en de nauwkeurigheid te behouden wanneer toppen klein of dicht opeengepakt zijn in luchtbeelden.

Figure 2. Een stapsgewijs proces toont rommelige tarwebeelden die worden opgeschoond tot duidelijke, gescheiden tarwekronen terwijl het model achtergrondruis wegfiltert.
Figure 2. Een stapsgewijs proces toont rommelige tarwebeelden die worden opgeschoond tot duidelijke, gescheiden tarwekronen terwijl het model achtergrondruis wegfiltert.

Het systeem op de proef stellen

Om te beoordelen hoe goed hun aanpak werkt onder realistische omstandigheden, trainden en testten de onderzoekers Mamba-WheatNet op GWHD-2021, een grote publieke verzameling dronebeelden van tarwevelden die veel variëteiten, plantindelingen en groeistadia omvat. Ze vergeleken hun systeem met verschillende toonaangevende objectdetectoren, waaronder de nieuwste YOLO-modellen en transformer-gebaseerde netwerken. Mamba-WheatNet behaalde hogere precisie en recall en een iets betere algehele detectiescore, terwijl het bescheiden rekenkracht gebruikte en snel genoeg draaide voor bijna realtime toepassing. Het team onderzocht ook hoe goed het model overdraagbaar is naar een andere dronedataset, VisDrone2019, die veel soorten kleine objecten in drukke stadsbeelden bevat. Ook daar leverde het model de beste nauwkeurigheid onder de geteste compacte detectoren, wat laat zien dat het ontwerp generaliseert buiten tarwe.

Wat dit betekent voor toekomstige slimme landbouw

De studie concludeert dat Mamba-WheatNet een praktische en nauwkeurige manier biedt om tarwekronen vanuit de lucht te tellen, zelfs wanneer velden visueel complex zijn. Door lichtgewicht, efficiënte lagen zorgvuldig te combineren met een globale scansmechaniek, houdt het model subtiele patronen bij zonder de hardware te overbelasten die typisch op drones of veldrobots voorkomt. Voor boeren, veredelaars en agronomen kan dit snellere, betrouwbaardere opbrengstschattingen en betere monitoring van de gewasgezondheid in de tijd betekenen, wat landbouw dichter bij meer datagedreven en precieze beheersing brengt.

Bronvermelding: Deng, G., Li, Z. & Gao, Z. Bidirectional state space modeling for lightweight and robust wheat head detection in complex agricultural environments. Sci Rep 16, 14895 (2026). https://doi.org/10.1038/s41598-026-45083-2

Trefwoorden: detectie van tarwekronen, dronebeeldmateriaal, deep learning, precisielandbouw, objectdetectie