Clear Sky Science · pl

Fuzja transformacji Gaussian-Haar usprawnia DEIM w wykrywaniu dojrzałości granatów

2026-02-11 · Powrót do spisu

Inteligentniejsze zbiory dla rosnącego świata

Dokładne określenie, kiedy owoc jest gotowy do zbioru, to jedna z najważniejszych — i najtrudniejszych — decyzji w rolnictwie. W tym badaniu problem rozwiązano dla granatów, uprawy o rosnącym znaczeniu ekonomicznym i odżywczym. Zamiast polegać na ludzkim oku lub powolnych testach laboratoryjnych, autorzy przedstawiają kompaktowy system sztucznej inteligencji, który analizuje zwykłe zdjęcia wykonane w realnych sadach i ocenia, na jakim etapie rozwoju znajduje się każdy granat, od małych pąków po w pełni dojrzałe owoce. Celem jest przyspieszenie i zwiększenie dokładności automatycznych zbiorów, prognozowania plonów i zarządzania sadami, a także umożliwienie działania na urządzeniach o niskiej mocy.

Dlaczego wzrost granatów trudno dostrzec

W realnych sadach wykrywanie granatów nie jest tak proste, jak się wydaje. Na początku sezonu małe zielone owoce niemal zlewają się z gęstymi, zielonymi liśćmi, co myli wiele istniejących metod widzenia komputerowego opierających się głównie na kolorze. Później, dojrzewające owoce mogą być częściowo zasłonięte przez liście lub znaleźć się w głębokim cieniu wskutek nierównomiernego oświetlenia, co powoduje, że algorytmy źle umieszczają ramki wykrywania lub całkowicie pomijają owoce. Większość wcześniejszych systemów koncentrowała się też na owocach po zbiorach lub na jednym punkcie cyklu wzrostu, co ogranicza ich przydatność przy planowaniu nawadniania, nawożenia i ochrony przed szkodnikami w całym sezonie. Na dodatek bardzo dokładne modele są często zbyt duże i energochłonne, by działać na małych komputerach robotów polowych i urządzeń brzegowych.

Nauka kamery, by widziała więcej niż kolor

Aby przezwyciężyć te trudności, badacze zbudowali nowy system wykrywania nazwany GLMF-DEIM. Najpierw przygotowali specjalistyczny zbiór danych składający się z 5 855 wysokiej jakości zdjęć z sadów w prowincji Shandong w Chinach, wykonanych od kwietnia do października w różnych warunkach oświetleniowych i pogodowych. Eksperci oznaczyli 11 482 pojedyncze pąki, kwiaty i owoce granatu, dzieląc je na pięć etapów wzrostu i trzy zakresy rozmiarów. Ta bogata kolekcja pozwala modelowi nauczyć się, jak wyglądają granaty na każdym etapie rozwoju — od maleńkich, ciasno zamkniętych pąków po duże, intensywnie zabarwione owoce — oraz jak prezentują się o różnych porach dnia i przy różnym pokryciu liści.

Patrzenie na fakturę i detale, nie tylko kolor

Rdzeń GLMF-DEIM stanowi zestaw sprytnych rozwiązań, które pomagają komputerowi odróżniać owoce od liści i dostrzegać małe, subtelne cechy bez marnowania mocy obliczeniowej. Moduł wejściowy stosuje operację matematyczną przypominającą rozdzielenie dźwięku na niskie i wysokie tony. Rozkłada obraz na gładkie obszary i ostre krawędzie, po uprzednim delikatnym wygładzeniu drobnego szumu tła. Ponieważ skórka granatów jest stosunkowo gładka, a liście tworzą złożone, teksturowane tło, takie podejście oparte na częstotliwościach ułatwia ich rozróżnienie nawet przy tym samym odcieniu zieleni. Inne lekkie moduły dostosowują sposób pomniejszania obrazu, tak by zachować istotne detale powierzchni związane z dojrzałością, oraz uczą się zwracać szczególną uwagę na informacje rozłożone w różnych skalach przestrzennych — od małych pąków po duże, dojrzałe owoce.

Widzenie każdego owocu, dużego i małego

Poza rozpoznawaniem pojedynczych tekstur system musi radzić sobie z owocami o wielu rozmiarach rozmieszczonymi w całej scenie. W tym celu autorzy zaprojektowali sieć fuzji cech, która buduje pewnego rodzaju piramidę reprezentacji obrazu. Na wyższych poziomach model uchwyta szerokie kształty; na niższych zatrzymuje drobne krawędzie i wzory. Informacja przepływa w górę i w dół tej piramidy, tak aby każda warstwa detekcji rozumiała zarówno kontekst, jak i lokalne detale. Głowica detekcyjna korzysta następnie z nowoczesnej architektury „transformera” — sposobu modelowania relacji między wieloma punktami obrazu jednocześnie — połączonej z dopracowaną strategią trenowania, która podaje gęsto zróżnicowane przykłady i funkcję straty karzącą zarówno zbyt pewne błędy, jak i zbyt mało pewne trafienia. Razem te wybory pomagają systemowi szybko zbiegać się i pozostawać odpornym w trudnych scenach z nachodzącymi na siebie owocami i zagraconym tłem.

Lepsza dokładność przy mniejszym zużyciu mocy obliczeniowej

W testach porównawczych z wiodącymi systemami wykrywania obiektów nowe podejście wypada najlepiej. Poprawnie identyfikuje dojrzałe granaty z około 93-procentową precyzją w standardowym ustawieniu oceny i utrzymuje silne wyniki nawet przy surowszych kryteriach oceny. W szczególności wykazuje znaczące poprawy dla małych, trudnych do zauważenia celów, przy jednoczesnym zachowaniu doskonałości dla dużych owoców. Jednocześnie wykorzystuje znacznie mniej obliczeń i parametrów niż ciężkie modele, dzięki czemu nadaje się do wdrożenia na robotach polowych, dronach czy tanich stacjach monitorujących. W praktyce oznacza to, że urządzenie z kamerą mogłoby przemierzać sad granatowy, niezawodnie śledzić rozwój owoców na poszczególnych drzewach i pomagać rolnikom decydować, kiedy i gdzie zbierać lub interweniować — bez potrzeby posiadania superkomputera w oborze.

Cytowanie: Wang, Y., Liu, S., Hao, P. et al. Gaussian-Haar transform fusion enhances DEIM for pomegranate maturity detection. Sci Rep 16, 8246 (2026). https://doi.org/10.1038/s41598-026-39620-2

Słowa kluczowe: wykrywanie granatów, dojrzałość owoców, inteligentne rolnictwo, widzenie komputerowe, modele głębokiego uczenia