Clear Sky Science · pl

Klasyfikacja chryzantem przez transformator wykorzystujący fuzję przestrzeni barw

· Powrót do spisu

Dlaczego pochodzenie i barwa kwiatu naprawdę mają znaczenie

Chryzantemy to nie tylko efektowne kwiaty na jesienne bukiety. W Chinach są też klasycznym środkiem leczniczym i cenną uprawą, lecz właściwości lecznicze i cena rynkowa w dużym stopniu zależą od odmiany rośliny i miejsca jej uprawy. Dziś rozróżnienie jednej chryzantemy leczniczej od innej często wymaga wprawnego oka, analiz chemicznych lub badań genetycznych — metod powolnych, kosztownych i trudnych do zastosowania w terenie. W tym badaniu zaprezentowano metodę opartą na zdjęciach z aparatu, która pozwala komputerowi szybko i precyzyjnie sortować chryzantemy tylko na podstawie obrazów, analizując kolor w nowy, dokładny sposób.

Widzieć kwiat tak, jak robi to aparat

Większość zdjęć cyfrowych zapisuje kolory jako mieszanki czerwieni, zieleni i błękitu (RGB). To dobrze działa do wyświetlania, lecz nie zawsze odpowiada temu, jak ludzie postrzegają jasność i subtelne odcienie, szczególnie przy zmieniającym się oświetleniu. Autorzy biorą standardowe obrazy RGB główek chryzantem — zwłaszcza tyły kwiatów, które zawierają bogate informacje strukturalne i kolorystyczne — i konwertują je do drugiego systemu barw zwanego LAB. W przestrzeni LAB jeden kanał opisuje jasność, a pozostałe dwa — różnice barw wzdłuż osi czerwonawo–zielonej i żółtawo–niebieskiej. Pracując jednocześnie w obu systemach, metoda zachowuje drobne detale oryginalnego zdjęcia, a jednocześnie uchwyca stabilniejsze, bardziej „ludzkie” różnice kolorystyczne między podobnymi kwiatami.

Figure 1
Figure 1.

Dwa równoległe spojrzenia na ten sam kwiat

Aby jak najlepiej wykorzystać te komplementarne widoki, badacze zaprojektowali sieć „wielo‑ścieżkową” — w praktyce dwie wyspecjalizowane ścieżki działające równolegle. Jedna ścieżka analizuje wersję obrazu w RGB, druga — w LAB. Każda ścieżka zbudowana jest z nowoczesnych bloków konwolucyjnych, rodzaju struktury głębokiego uczenia świetnej w wychwytywaniu krawędzi, tekstur i kształtów. Wczesne warstwy skupiają się na konturach płatków i drobnych wzorach tekstury, podczas gdy głębsze warstwy podsumowują szersze struktury. Na kilku etapach sieć łączy to, czego nauczyła się każda ścieżka, przez sklejenie ich map cech. Pozwala to modelowi zestawić wyraźne kontury z RGB z bardziej gładką, odporną na oświetlenie strukturą kolorystyczną z LAB, łącząc je w bogatszy wewnętrzny obraz każdego kwiatu.

Pozwolić uwadze znaleźć istotne detale

Gdy równoległe ścieżki sprowadzą obrazy kwiatów do zwartej reprezentacji cech, przejmuje drugi rodzaj modelu: vision transformer. Transformatory zostały pierwotnie wymyślone do języka, gdzie dobrze wychwytują związki na długim dystansie, i odgrywają rosnącą rolę w analizie obrazów. Tutaj złączone cechy chryzantem są podzielone na wiele małych patchy i podawane transformerowi, który dzięki mechanizmowi „uwagi” decyduje, które fragmenty obrazu są najważniejsze do rozróżnienia odmian. To globalne spojrzenie pomaga sieci powiązać subtelne różnice kolorystyczne przy nasadzie płatków z wzorami dalej na główce kwiatu, co prowadzi do bardziej wiarygodnej oceny typu i pochodzenia każdego kwiatu.

Weryfikacja systemu

Zespół zgromadził obszerny zbiór obrazów: ponad 9 000 fotografii tyłów i przodów kwiatów z 18 typów chryzantem i 15 rejonów uprawy, przy czym niektóre odmiany — jak chryzantema Hangbai — występowały w wielu lokalizacjach. Trenowali i oceniali swój model na tym zbiorze oraz porównali go z dobrze znanymi architekturami głębokiego uczenia powszechnie stosowanymi w rozpoznawaniu obrazów. Wyniki są uderzające: na zdjęciach tylnej strony nowa metoda osiągnęła dokładność około 96–97% na ich własnym zbiorze chryzantem i ponad 99% na standardowym publicznym benchmarku obrazów kwiatów. Przewyższyła kilka silnych konkurentów, w tym zarówno czysto konwolucyjne sieci, jak i czysto transformerowe modele, utrzymując nie tylko wysoką dokładność, ale też stabilność działania w wielu różnych kategoriach chryzantem.

Figure 2
Figure 2.

Co to oznacza dla hodowców i medycyny ziołowej

Mówiąc prościej, badanie pokazuje, że starannie zaprojektowany system analizy obrazów może dorównać — a w niektórych przypadkach przewyższyć — wiarygodność bardziej skomplikowanych laboratoriów przy rozpoznawaniu chryzantem leczniczych. Łącząc dwa sposoby reprezentacji koloru z dwoma komplementarnymi typami sieci neuronowych, metoda potrafi wychwycić drobne wskazówki wizualne odróżniające podobne kwiaty z różnych regionów. To może wspierać szybkie kontrole jakości na targowiskach, pomagać w ustalaniu rzeczywistego pochodzenia suszonych główek kwiatów i w przyszłości rozszerzać zastosowanie na inne rośliny lecznicze, które wymagają precyzyjnej identyfikacji odmian. W miarę jak takie narzędzia trafią z laboratorium do urządzeń przenośnych lub maszyn sortujących, mogą udostępnić „wprawne oko” eksperta wszędzie tam, gdzie uprawia się, handluje lub przepisuje rośliny lecznicze.

Cytowanie: Jiang, J., Yang, X., Wang, T. et al. Chrysanthemum classification via color space fusion transformer. Sci Rep 16, 9397 (2026). https://doi.org/10.1038/s41598-026-40027-2

Słowa kluczowe: klasyfikacja chryzantem, rozpoznawanie obrazów roślin, fuzja przestrzeni barw, vision transformer, zioła lecznicze