Clear Sky Science · ru

Унифицированная платформа на базе EfficientSwinB для распознавания лекарственных растений и классификации генетических ресурсов сафлора

· Назад к списку

Почему важно умнее определять растения

От кухонных трав до традиционных средств многие растения, на которых основывается наше здоровье, внешне выглядят удивительно похоже. Различать их визуально требует многолетней подготовки, а ошибки могут повлиять на качество лекарств, сельскохозяйственные решения и усилия по сохранению биоразнообразия. В этом исследовании представлена новая платформа искусственного интеллекта (ИИ), которая способна распознавать лекарственные растения по обычным фотографиям и даже отличать очень близкородственные сорта сафлора по листьям. Ускоряя и повышая надежность идентификации растений, работа прокладывает путь к практичным инструментам для фармацевтов, фермеров и специалистов по охране природы.

Figure 1
Figure 1.

От снимков листьев к достоверным ответам

Авторы сосредотачиваются на одном из самых сложных вариантов распознавания растений: работе непосредственно с изображениями листьев. Съемки лекарственных растений на открытом воздухе запутаны почвой, тенями и другими растениями, при этом у многих видов почти идентичные формы и рисунок жилок. Традиционные методы компьютерного зрения требовали больших, тщательно отобранных наборов данных и все равно испытывали сложности с такой вариативностью. Здесь исследователи опираются на современное семейство моделей ИИ — vision transformer, которые трактуют изображение как набор маленьких патчей и изучают взаимосвязи между этими фрагментами. Их цель — создать единую платформу, способную справляться как с широким распознаванием видов в естественных условиях, так и с тонкими различиями между сортами в лаборатории.

Более компактный и точный «взор» для лекарственных растений

Для общего распознавания лекарственных растений команда предлагает модель под названием EfficientSwinB-SE. Она берет за основу Swin Transformer — популярный vision transformer, который анализирует перекрывающиеся окна изображения, чтобы улавливать и локальные детали, и общую сцену. Первое улучшение — шаг обрезки (pruning): модель автоматически удаляет наименее полезные связи в раннем слое обработки изображения, сокращая внутренние вычисления без изменения общей архитектуры. Второе улучшение — блок squeeze-and-excitation, который обучает модель придавать больший вес некоторым визуальным каналам по сравнению с другими, подобно тому, как ботаник уделяет особое внимание структуре жилок или текстуре краев, игнорируя отвлекающие фоновые пиксели.

Увеличивая внимание к различиям в семействе сафлора

Распознавание сортов внутри одной культуры даже сложнее, чем отличать разные виды, поскольку визуальные различия могут быть чрезвычайно тонкими. Чтобы справиться с этим, авторы расширяют свою платформу второй моделью под названием OLSF-EfficientSwinB-SE, адаптированной для генетических линий сафлора — семенного материала, используемого в селекции. В лабораторных условиях они сначала улучшают изображения листьев с помощью процедуры «Оптимальная структурная особенность листа» (Optimal Leaf Structure Feature), которая подчеркивает направления жилкования и тонкую текстуру. Эти улучшенные изображения затем подаются в тот же подрезанный и внимательный трансформерный бэкбон. Такое сочетание помогает ИИ сосредоточиться на крошечных, но биологически значимых структурных признаках, отличающих одну линию сафлора от другой, что способствует более точной селекции и управлению генетическими ресурсами.

Figure 2
Figure 2.

Тестирование новой платформы

Исследователи оценивают свои модели на трех общедоступных наборах данных: индийские лекарственные растения, сфотографированные в садах; индонезийские лекарственные растения, собранные из разнообразных онлайн-источников; и набор данных сафлора, содержащий десятки сортов, отснятых в контролируемых лабораторных условиях. Во всех случаях EfficientSwinB-SE превосходит известные модели глубокого обучения, включая классические свёрточные сети и другие трансформеры. Модель достигает примерно 99.75% точности на индийском наборе и 97.70% на индонезийском, даже при различном освещении и загроможденном фоне. Для детализированной задачи по сафлору вариант OLSF-EfficientSwinB-SE достигает около 91.63% точности, опережая ранее предложенный трансформерный подход, специально разработанный для этой культуры.

Что это значит для практического использования растений

Проще говоря, исследование показывает, что возможно создать единый, эффективный «глаз» ИИ, который может одновременно распознавать широкий спектр лекарственных растений в полевых условиях и надежно сортировать почти идентичные листья в лаборатории. Устраняя лишние вычисления и обучая модель выделять наиболее информативные визуальные подсказки, авторы создают инструменты, которые точны, устойчивы и достаточно практичны для почти реального времени. Такие системы могут лечь в основу мобильных приложений для определения трав, автоматизированного каталогизирования генетических ресурсов и интеллектуальных фермерских платформ, отслеживающих культуры по листьям. По мере расширения идей на большее число видов и сред они могут помочь объединить традиционные знания о растениях и современное основанное на данных сельское хозяйство.

Цитирование: Khuat, P.T., Thien Van, H. A unified EfficientSwinB-based framework for medicinal plant recognition and safflower germplasm classification. Sci Rep 16, 11791 (2026). https://doi.org/10.1038/s41598-026-42449-4

Ключевые слова: распознавание лекарственных растений, глубокое обучение, vision transformer, генетические ресурсы сафлора, идентификация растений