Clear Sky Science · pl
Ulepszony YOLO12 z pulą przestrzenną do wykrywania owadów w bawełnie w czasie rzeczywistym
Dlaczego wykrywanie malutkich owadów ma znaczenie
Bawełna może wydawać się prostą rośliną, ale jej rola na świecie jest ogromna: ubiera miliardy ludzi, daje pracę milionom osób i zasila przemysły od olejów spożywczych po kosmetyki. Tymczasem całe pola bawełny mogą być cicho niszczone przez owady ledwie większe od ziarenka ryżu. Rolnicy często polegają na częstych obchódach pól i intensywnym stosowaniu pestycydów, by powstrzymać te szkodniki — metody te są czasochłonne, kosztowne i szkodliwe dla środowiska. W badaniu tym zbadano, jak nowa forma sztucznej inteligencji może obserwować pola bawełny w czasie rzeczywistym, automatycznie wykrywając szkodliwe owady na liściach, tak by zabiegi były bardziej precyzyjne i znacznie mniej marnotrawne.

Od ręcznych obchódów do inteligentnych kamer
Dziś wielu rolników lub pracowników polowych nadal chodzi między rzędami bawełny, wizualnie kontrolując liście i kwiaty pod kątem szkodników. Takie podejście jest ograniczone przez zmęczenie człowieka, nierównomierne pokrycie terenu oraz zmieniające się warunki oświetleniowe i pogodowe. Pestycydy o szerokim spektrum działania, często stosowane według harmonogramu zamiast w reakcji na rzeczywistą potrzebę, mogą zabijać pożyteczne owady, zanieczyszczać glebę i wodę oraz zwiększać koszty produkcji. Autorzy proponują, że bardziej zrównoważoną drogą jest pozwolić komputerom „widzieć” owady bezpośrednio na zdjęciach z pola, dając rolnikom zautomatyzowany system wczesnego ostrzegania, który precyzyjnie ukierunkuje działania tam, gdzie faktycznie występują szkodniki.
Nauka komputerów rozpoznawania malutkich owadów
Aby zbudować taki system, naukowcy sięgnęli po uczenie głębokie, gałąź SI doskonałą w rozpoznawaniu wzorców na obrazach. Użyli rodziny modeli zwanych YOLO (You Only Look Once), które potrafią przeskanować obraz i w ułamku sekundy narysować prostokąty wokół obiektów. Startując od najnowszego modelu YOLO12, stworzyli nową, ulepszoną wersję dostosowaną do szkodników bawełny. Najpierw skatalogowali i dopracowali wysokiej jakości otwarty zbiór danych zawierający 3 225 zdjęć z rzeczywistych pól bawełny, obejmujący 13 powszechnych typów owadów, takich jak biedronki, tarczniki i gąsienice. Przekonwertowali oryginalne etykiety do standardowego formatu czytelnego dla modelu i starannie zbalansowali liczbę zdjęć dla każdej klasy owadów, aby SI nie faworyzowała najczęściej występujących gatunków.
Wyróżnianie małych owadów
Wykrywanie owadów na liściach jest znacznie trudniejsze niż rozpoznawanie dużych obiektów, takich jak samochody czy ludzie. Owady są malutkie, często zamaskowane i mogą pojawiać się w różnych skalach i kątach. Aby sobie z tym poradzić, zespół ulepszył architekturę YOLO12 na kilka sposobów. Dodali wyspecjalizowane bloki, które pomagają modelowi uchwycić drobne detale, zachowując jednocześnie zrozumienie całości sceny. Moduł „spatial pyramid pooling” pozwala sieci oglądać ten sam obszar na wielu skalach jednocześnie, co jest kluczowe dla dostrzegania zarówno bardzo małych, jak i nieco większych owadów na tym samym zdjęciu. Mechanizm uwagi pomaga następnie modelowi podkreślić najbardziej informacyjne części obrazu — subtelne kształty, kolory i tekstury, które odróżniają jeden owad od drugiego — przy jednoczesnym ignorowaniu nieistotnego tła.
Testowanie modeli
Autorzy nie zaproponowali jednego modelu; zbudowali i porównali sześć różnych konstrukcji opartych na YOLO, w tym standardowe YOLO11 i YOLO12 oraz kilka wariantów własnych. Wszystkie były trenowane i testowane na tym samym zbiorze danych o owadach bawełny, aby zapewnić uczciwe porównanie. Najlepszy model, nazwany Enhanced Hybrid YOLO12, osiągnął bardzo wysokie wyniki w standardowych miarach jakości detekcji, równoważąc częstotliwość poprawnego wykrywania owadów z precyzją rysowanych ramek ograniczających. W porównaniu z oryginalnym YOLO12 podniósł zarówno ogólną jakość wykrywania, jak i spójność w różnych warunkach testowych, przy nadal wystarczająco szybkim działaniu do użytku w czasie rzeczywistym na nowoczesnym sprzęcie graficznym. Chociaż ten ulepszony model jest nieco bardziej wymagający obliczeniowo, autorzy pokazują, że zysk w niezawodności jest szczególnie cenny w rzeczywistym rolnictwie.

Co to oznacza dla rolników i środowiska
Mówiąc prostymi słowami, badanie pokazuje, że kamera z wyuczonym modelem AI może działać jak niestrudzony cyfrowy zwiadowca, skanując liście bawełny pod kątem szkodników przez całą dobę. Ponieważ system Enhanced Hybrid YOLO12 lepiej unika fałszywych alarmów niż wcześniejsze wersje, może pomóc rolnikom opryskiwać tylko tam i wtedy, gdy owady faktycznie występują, ograniczając użycie chemikaliów, oszczędzając pieniądze i zmniejszając szkody dla pożytecznych gatunków oraz okolicznych ekosystemów. Choć potrzebne są dalsze prace nad uruchomieniem modelu na tańszych urządzeniach oraz rozszerzeniem go na większą liczbę gatunków owadów i regionów uprawy, badania te wskazują przyszłość, w której rolnictwo precyzyjne zamienia zwalczanie szkodników z zgadywanki w działanie oparte na danych.
Cytowanie: Saif, D., Askr, H., Sarhan, A.M. et al. Enhanced YOLO12 with spatial pyramid pooling for real-time cotton insect detection. Sci Rep 16, 4806 (2026). https://doi.org/10.1038/s41598-026-35747-4
Słowa kluczowe: szkodniki bawełny, rolnictwo precyzyjne, uczenie głębokie, detekcja obiektów, rolnictwo zrównoważone