Clear Sky Science · ru
Слияние преобразований Gaussian-Haar улучшает DEIM для определения спелости граната
Более разумный сбор урожая для растущего мира
Точное определение момента, когда плод готов к сбору, — одно из важнейших и одновременно самых сложных решений в сельском хозяйстве. В этом исследовании рассматривается проблема для гранатов — культуры, набирающей экономическое и пищевое значение. Вместо опоры на человеческий взгляд или медленные лабораторные анализы авторы предлагают компактную систему искусственного интеллекта, которая по обычным снимкам, сделанным в реальных садах, способна оценить степень развития каждого граната — от крошечных бутонов до полностью созревших плодов. Их цель — сделать автоматизированный сбор, прогноз урожайности и управление садом быстрее, точнее и практичнее даже на энергоэффективных устройствах.

Почему рост граната трудно заметить
В реальных садах обнаружить гранаты не так просто, как кажется. В начале сезона маленькие зелёные плоды почти сливаются с плотной листвой, что сбивает с толку многие существующие методы компьютерного зрения, ориентированные в основном на цвет. Позже созревающие плоды могут частично скрываться за листьями или оказываться в глубоких тенях из‑за неравномерного освещения, из‑за чего алгоритмы ставят ограничивающие рамки неправильно или вовсе пропускают плоды. Большинство предыдущих систем также сосредоточено на плодах после сбора или на одной точке цикла развития, что ограничивает их полезность при планировании орошения, внесения удобрений и борьбы с вредителями в течение сезона. Кроме того, очень точные модели часто слишком большие и энергозатратные, чтобы запускаться на небольших компьютерах полевых роботов и периферийных устройств.
Научить камеру видеть не только цвет
Чтобы преодолеть эти трудности, исследователи построили новую систему обнаружения, которую назвали GLMF-DEIM. Сначала они собрали специализированный набор данных из 5 855 качественных изображений из садов провинции Шаньдун, Китай, снятых с апреля по октябрь при разных условиях освещения и погоды. Эксперты разметили 11 482 отдельных бутона, цветка и плода граната, разбив их на пять стадий развития и три диапазона размеров. Эта богатая коллекция позволяет модели изучать, как выглядят гранаты на каждом этапе развития — от крошечных плотно закрытых бутонов до крупных яркоокрашенных зрелых плодов — и как они проявляются в разное время суток и при разной степени листовой прикрытости.
Смотреть на текстуру и детали, а не только на цвет
Ядро GLMF-DEIM — набор изящных приёмов, которые помогают компьютеру отличать плоды от листвы и замечать маленькие, тонкие признаки, не расходуя лишних вычислений. Передний модуль использует математическую операцию, похожую на разложение звука на низкие и высокие частоты. Он декомпозирует изображение на плавные области и резкие края, предварительно мягко сглаживая мелкий фоновый шум. Поскольку кожа граната относительно гладкая, а листья образуют насыщенный текстурный фон, такой частотный взгляд облегчает их разделение даже при одинаковых оттенках зелёного. Другие лёгкие модули адаптируют способы уменьшения изображения так, чтобы важные поверхностные детали, связанные со зрелостью, сохранялись, и учатся уделять особое внимание информации, распределённой по разным пространственным масштабам — от маленьких бутонов до крупных зрелых плодов.

Видеть каждый плод — большой или маленький
Помимо распознавания отдельных текстур, системе необходимо работать с плодами разных размеров, разбросанными по сцене. Для этого авторы спроектировали сеть слияния признаков, строящую своего рода пирамиду представлений изображения. На верхних уровнях модель улавливает общие формы; на нижних — сохраняет тонкие края и узоры. Информация течёт вверх и вниз по этой пирамиде, так что каждый слой детекции понимает и контекст, и локальные детали. Голова детектора затем использует современную архитектуру «трансформер» — способ моделирования взаимосвязей между множеством точек изображения одновременно — в сочетании с усовершенствованной стратегией обучения, которая подаёт ей густо вариативные примеры и функцию потерь, штрафующую как чрезмерно уверенные ошибки, так и недостаточно уверенные попадания. В совокупности эти решения помогают системе быстро сходиться и оставаться устойчивой в сложных сценах с накладывающимися плодами и загромождённым фоном.
Более высокая точность при меньших затратах вычислений
В параллельных тестах против ведущих систем обнаружения объектов новый подход показывает лучшие результаты. Он правильно определяет зрелые гранаты с примерно 93-процентной точностью при стандартных условиях оценки и сохраняет высокую эффективность даже при строгих правилах подсчёта. Особенно заметны улучшения для маленьких, трудноразличимых целей, при этом система также превосходна в работе с крупными плодами. Одновременно она требует гораздо меньше вычислений и параметров по сравнению с тяжёлыми моделями, что делает её пригодной для развёртывания на полевых роботах, дронах или недорогих мониторинговых станциях. Проще говоря, это означает, что устройство с камерой может обходить сад гранатов, надёжно отслеживать, как развивается плод на каждом дереве, и помогать фермерам решать, когда и где собирать урожай или вмешиваться — всё это без необходимости в суперкомпьютере в амбаре.
Цитирование: Wang, Y., Liu, S., Hao, P. et al. Gaussian-Haar transform fusion enhances DEIM for pomegranate maturity detection. Sci Rep 16, 8246 (2026). https://doi.org/10.1038/s41598-026-39620-2
Ключевые слова: обнаружение гранатов, спелость плодов, умное сельское хозяйство, компьютерное зрение, модели глубокого обучения