Clear Sky Science · sv
Bidirektionell tillståndsrymdsmodellering för lättvikts- och robust upptäckt av veteax i komplexa jordbruks-miljöer
Varför det är viktigt att räkna veteax från luften
Att föda en växande värld kräver att vi vet hur mycket våra fält kan producera, och en viktig ledtråd kommer från veteaxen, de kärnbärande topparna på varje planta. Jordbrukare och växtförädlare har länge räknat dessa för hand för att uppskatta avkastning, men att göra det över stora fält är långsamt, kostsamt och känsligt för fel. Denna studie introducerar ett nytt datorvisionssystem, Mamba-WheatNet, som använder bilder från drönare för att automatiskt upptäcka och räkna veteax i realtid, även när fälten är störiga, täta och belysta av skiftande solljus.
Smarta ögon över komplexa fält
Verkliga fält är långt ifrån prydliga. Veteax kan döljas av blad, överlappa varandra eller blandas med ogräs och bar jord, och deras färg och form förändras när de växer. Tidigare metoder försökte förlita sig på enkla egenskaper som färg eller textur, men dessa fallerar när ljusförhållanden eller växtstadium förändras. Djupinlärning har förbättrat situationen genom att låta neurala nätverk lära sig mönster direkt från många bilder. Många befintliga modeller har dock fortfarande problem med röriga scener och kräver ofta tung beräkningskraft som är svår att köra på drönare eller små fältapparater.

En lättare modell som fokuserar på det som är viktigt
Mamba-WheatNet är designad för att hantera dessa utmaningar samtidigt som den hålls tillräckligt lätt för praktisk användning i fält. Den kombinerar två huvudidéer: effektiva konvolutionslager, som är bra på att fånga lokala detaljer, och en nyare familj av modeller känd som selektiva tillståndsrymder, vilka är bättre på att spåra långräckta mönster. Författarna bygger en funktionsutdragare som först bryter ner bilder i flerskaliga mönster och sedan skickar dem genom ett särskilt fusionssteg som söker över hela scenen. Detta hjälper systemet att ignorera bakgrundsstörningar, såsom överlappande blad eller jord, och i högre grad uppmärksamma de subtila former och nyanser som markerar individuella veteax.
Hur modellen reder ut tätpackade veteax
Inuti Mamba-WheatNet gör två specialbyggda block det mesta av det tunga lyftet. Det ena, kallat Residual Depthwise Separable Block, använder lätta konvolutioner uppdelade över kanaler för att fånga fina detaljer utan att blåsa upp antalet beräkningar. Det andra, Bidirectional Spatial Scanning Block, skannar funktionskartor horisontellt och vertikalt, samlar kontext i båda riktningarna samtidigt som det selektivt betonar de mest informativa kanalerna. Dessa komponenter kombineras till en större fusionsenhet som blandar lokala och globala signaler, vilket gör det lättare att separera sammanfogade eller överlappande veteax och behålla noggrannhet när axen är små eller tätt packade i flygbilder.

Sätta systemet på prov
För att se hur väl deras tillvägagångssätt fungerar i realistiska förhållanden tränade och testade forskarna Mamba-WheatNet på GWHD-2021, en stor offentlig samling drönarbilder av vetefält som täcker många sorter, planteringsmönster och växtstadier. De jämförde sitt system med flera ledande objektidentifierare, inklusive de senaste YOLO-modellerna och transformatorbaserade nätverk. Mamba-WheatNet uppnådde högre precision och recall samt något bättre övergripande detektionspoäng samtidigt som den använde måttlig beräkningskraft och körde tillräckligt snabbt för nära realtidsbruk. Teamet kontrollerade också hur väl modellen överförs till en annan drönardatamängd, VisDrone2019, som innehåller många typer av små objekt i täta stadsscener. Även där levererade modellen den bästa noggrannheten bland de kompakta detektorer som testades, vilket visar att dess design generaliserar bortom vete.
Vad detta betyder för framtidens smarta jordbruk
Studien drar slutsatsen att Mamba-WheatNet erbjuder ett praktiskt och noggrant sätt att räkna veteax från luften, även när fälten är visuellt komplexa. Genom att noggrant kombinera lätta, effektiva lager med en global skanningsmekanism håller modellen koll på subtila mönster utan att överbelasta hårdvara som vanligtvis finns på drönare eller fältrobotar. För jordbrukare, förädlare och agronomer kan detta innebära snabbare, mer tillförlitliga skördeuppskattningar och bättre övervakning av grödhälsa över tid, vilket hjälper jordbruket att röra sig mot mer datadriven och precis förvaltning.
Citering: Deng, G., Li, Z. & Gao, Z. Bidirectional state space modeling for lightweight and robust wheat head detection in complex agricultural environments. Sci Rep 16, 14895 (2026). https://doi.org/10.1038/s41598-026-45083-2
Nyckelord: upptäckt av veteax, drönarbilder, djupinlärning, precisionjordbruk, objektigenkänning