Clear Sky Science · ru

Классификация хризантем с помощью трансформера с объединением цветовых пространств

· Назад к списку

Почему родная местность и цвет цветка действительно важны

Хризантемы — это не просто красивые цветы для осенних букетов. В Китае они также являются классическим лекарственным средством и ценной культурой, но их лечебные свойства и рыночная цена сильно зависят от сорта растения и места его выращивания. Сегодня отличить одну лекарственную хризантему от другой часто можно только с помощью опытного глаза, химических анализов или генетического тестирования — методов, которые медленные, дорогие и плохо подходят для использования в полевых условиях. В этом исследовании предложен метод на основе камеры, который позволяет компьютеру быстро и точно сортировать хризантемы по изображениям, рассматривая цвет новым, более тщательным способом.

Видеть цветы так, как видит камера

Большинство цифровых фото сохраняют цвет как смеси красного, зелёного и синего (RGB). Это хорошо для отображения, но не всегда совпадает с тем, как человек воспринимает яркость и тонкие цветовые сдвиги, особенно при изменении освещения. Авторы берут привычные RGB‑изображения корзинок хризантем — особенно с оборотной стороны цветков, где сосредоточены богатые структурные и цветовые подсказки — и преобразуют их во вторую цветовую систему, известную как LAB. В LAB один канал отвечает за свет‑тёмность, а два других описывают различия цвета по осям «красно‑зелёный» и «жёлто‑сине‑голубой». Работая в обеих системах одновременно, метод сохраняет тонкие детали оригинального фото и одновременно фиксирует более устойчивые, «человеко‑похожие» цветовые отличия между похожими цветками.

Figure 1
Figure 1.

Два параллельных взгляда на один и тот же цветок

Чтобы максимально использовать эти дополняющие друг друга представления, исследователи разработали «многопутевую» сеть — по сути, две экспертные линии, работающие параллельно. Одна линия изучает RGB‑версию каждого изображения, а другая анализирует LAB‑версию. Каждая ветвь построена из современных сверточных блоков — типа глубинных сетей, которые отлично выявляют контуры, текстуры и формы. Ранние слои обращают внимание на контуры лепестков и мелкие текстурные узоры, тогда как более глубокие суммируют более широкие структуры. На нескольких этапах сеть объединяет знания обеих ветвей, складывая их карты признаков. Это позволяет модели сопоставлять чёткие контуры из RGB с более плавной, освещённо‑устойчивой цветовой структурой из LAB, формируя более насыщённое внутреннее представление каждого цветка.

Позволить вниманию найти свидетельствующие детали

После того как параллельные ветви свели изображения цветков к компактным картам признаков, в работу вступает второй тип модели: vision transformer. Трансформеры изначально были созданы для языка, где они хорошо улавливают дальние связи, и теперь всё чаще применяются в анализе изображений. Здесь объединённые признаки хризантем разбиваются на множество маленьких патчей и подаются трансформеру, который с помощью механизма «внимания» решает, какие патчи наиболее важны для различения сортов. Этот глобальный обзор помогает сети связать тонкие цветовые отличия у основания лепестков с узорами дальше на корзинке цветка, что даёт более надёжный вердикт о типе и происхождении каждого цветка.

Проверка системы на практике

Команда собрала внушительную коллекцию изображений: более 9 000 фотографий оборотной и лицевой стороны цветков 18 типов хризантем из 15 районов выращивания, при этом некоторые сорта — например, хризантема Хангбай — представлены в разных локалитетах. Они обучали и оценивали свою модель на этом наборе данных и сравнивали её с известными архитектурами глубокого обучения, широко используемыми для распознавания изображений. Результаты впечатляют: работая с изображениями обратной стороны, новый метод достиг точности порядка 96–97% на их собственном датасете хризантем и более 99% на стандартном публичном бенчмарке изображений цветов. Он превзошёл несколько сильных конкурентов, включая как чисто сверточные сети, так и чисто трансформерные модели, демонстрируя не только высокую точность, но и стабильную работу по многим категориям хризантем.

Figure 2
Figure 2.

Что это значит для фермеров и фитотерапии

Проще говоря, исследование показывает, что тщательно спроектированная система анализа изображений может соперничать — а в ряде случаев и превосходить — надёжность более сложных лабораторных подходов для распознавания лекарственных хризантем. Сочетая два способа представления цвета с двумя дополняющими типами нейронных сетей, метод способен выявлять тонкие визуальные подсказки, которые отличают похожие цветы из разных регионов. Это может поддержать быстрые проверки качества на рынках, помочь отследить настоящее происхождение высушенных корзинок цветков и в перспективе распространиться на другие лекарственные растения, для которых важна точная идентификация сорта. По мере переноса таких инструментов из лабораторий в карманные устройства или сортировочные машины они обещают сделать «натренированный глаз» эксперта доступным там, где выращивают, торгуют или назначают лекарственные растения.

Цитирование: Jiang, J., Yang, X., Wang, T. et al. Chrysanthemum classification via color space fusion transformer. Sci Rep 16, 9397 (2026). https://doi.org/10.1038/s41598-026-40027-2

Ключевые слова: классификация хризантем, распознавание изображений растений, объединение цветовых пространств, vision transformer, лекарственные травы