Clear Sky Science · pl

Dwukierunkowe modelowanie przestrzeni stanów dla lekkiego i odpornego wykrywania kłosów pszenicy w złożonych środowiskach rolniczych

· Powrót do spisu

Dlaczego liczenie kłosów z powietrza ma znaczenie

Karmienie rosnącej populacji świata zależy od wiedzy o tym, ile żywności mogą wyprodukować nasze pola, a jednym z kluczowych wskaźników są kłosy pszenicy — ziarno-noszące końcówki każdej rośliny. Rolnicy i hodowcy od dawna zliczają je ręcznie, by oszacować plon, ale robienie tego na dużą skalę jest wolne, kosztowne i obarczone błędami. W tym badaniu przedstawiono nowy system widzenia komputerowego, Mamba-WheatNet, który wykorzystuje obrazy z dronów do automatycznego wykrywania i zliczania kłosów pszenicy w czasie rzeczywistym, nawet gdy pola są chaotyczne, gęste i oświetlone zmiennym światłem słonecznym.

Inteligentne oko nad złożonymi polami

Prawdziwe pola są dalekie od porządku. Kłosy pszenicy mogą być ukryte przez liście, zachodzić na siebie lub mieszać się z chwastami i gołą ziemią, a ich kolor i kształt zmieniają się w miarę wzrostu. Wcześniejsze metody polegały na prostych cechach, takich jak kolor czy faktura, co zawodzi przy zmianach oświetlenia lub stadium wzrostu. Głębokie uczenie poprawiło sytuację, pozwalając sieciom neuronowym uczyć się wzorców bezpośrednio z wielu obrazów. Jednak wiele istniejących modeli wciąż ma trudności z zabałaganionymi scenami i często wymaga dużej mocy obliczeniowej, trudnej do uruchomienia na dronach czy małych urządzeniach polowych.

Figure 1. Obrazy pól pszenicy z dronów trafiają do inteligentnego modelu, który wyróżnia i zlicza kłosy pszenicy w celu oszacowania plonu.
Figure 1. Obrazy pól pszenicy z dronów trafiają do inteligentnego modelu, który wyróżnia i zlicza kłosy pszenicy w celu oszacowania plonu.

Lżejszy model, który skupia się na tym, co ważne

Mamba-WheatNet został zaprojektowany, by radzić sobie z tymi wyzwaniami, pozostając jednocześnie wystarczająco lekkim dla praktycznego wykorzystania na farmie. Łączy dwie główne idee: wydajne warstwy splotowe, które dobrze wychwytują lokalne detale, oraz nowszą rodzinę modeli znanych jako selektywne przestrzenie stanów, lepsze w śledzeniu zależności na długim dystansie. Autorzy zbudowali ekstraktor cech, który najpierw dekomponuje obrazy na wzorce wieloskalowe, a następnie przekazuje je przez specjalny etap fuzji przeglądający całą scenę. Pomaga to systemowi ignorować tło i zakłócenia, takie jak nachodzące na siebie liście czy gleba, i lepiej skupiać się na subtelnych kształtach i odcieniach definiujących pojedyncze kłosy.

Jak model rozplątuje gęste kłosy

W Mamba-WheatNet dwie niestandardowe jednostki wykonują większość ciężkiej pracy. Jedna, nazwana Residual Depthwise Separable Block, wykorzystuje lekkie sploty podzielone na kanały, by uchwycić drobne detale bez znaczącego zwiększania obliczeń. Druga, Bidirectional Spatial Scanning Block, skanuje mapy cech poziomo i pionowo, zbierając kontekst w obu kierunkach i selektywnie wzmacniając najbardziej informacyjne kanały. Te elementy są łączone w większą jednostkę fuzji, która miesza sygnały lokalne i globalne, ułatwiając rozdzielanie stykających się lub zachodzących na siebie kłosów oraz utrzymanie dokładności, gdy kłosy są małe lub gęsto upakowane na zdjęciach lotniczych.

Figure 2. Proces krok po kroku pokazuje, jak zabałaganione sceny pszenicy są oczyszczane do wyraźnych, oddzielonych kłosów, gdy model filtruje tło i zakłócenia.
Figure 2. Proces krok po kroku pokazuje, jak zabałaganione sceny pszenicy są oczyszczane do wyraźnych, oddzielonych kłosów, gdy model filtruje tło i zakłócenia.

Testy systemu

Aby sprawdzić skuteczność podejścia w realistycznych warunkach, badacze trenowali i testowali Mamba-WheatNet na GWHD-2021, dużym publicznym zbiorze zdjęć dronowych pól pszenicy obejmującym wiele odmian, układów obsiewu i etapów wzrostu. Porównali swój system z kilkoma wiodącymi detektorami obiektów, w tym najnowszymi modelami YOLO i sieciami opartymi na transformerach. Mamba-WheatNet osiągnął wyższą precyzję i czułość oraz nieco lepsze ogólne wyniki detekcji, przy umiarkowanym zapotrzebowaniu na moc obliczeniową i szybkości działania pozwalającej na niemal czas rzeczywisty. Zespół sprawdził też transfer modelu na inny zbiór dronowy, VisDrone2019, zawierający wiele typów małych obiektów w zatłoczonych scenach miejskich. Tam również model dostarczył najlepszą dokładność wśród testowanych kompaktowych detektorów, co pokazuje, że jego konstrukcja uogólnia się poza samą pszenicę.

Co to oznacza dla przyszłości inteligentnego rolnictwa

Badanie konkluduje, że Mamba-WheatNet oferuje praktyczny i dokładny sposób zliczania kłosów pszenicy z powietrza, nawet gdy pola są wizualnie złożone. Poprzez staranne połączenie lekkich, wydajnych warstw z mechanizmem globalnego skanowania, model śledzi subtelne wzorce nie obciążając typowego sprzętu stosowanego na dronach czy robotach polowych. Dla rolników, hodowców i agronomów może to oznaczać szybsze, bardziej wiarygodne szacunki plonów i lepsze monitorowanie zdrowia upraw w czasie, wspierając przejście rolnictwa w kierunku bardziej opartego na danych i precyzyjnego zarządzania.

Cytowanie: Deng, G., Li, Z. & Gao, Z. Bidirectional state space modeling for lightweight and robust wheat head detection in complex agricultural environments. Sci Rep 16, 14895 (2026). https://doi.org/10.1038/s41598-026-45083-2

Słowa kluczowe: wykrywanie kłosów pszenicy, fotografia dronowa, głębokie uczenie, rolnictwo precyzyjne, detekcja obiektów