Clear Sky Science · ru

Повышение эффективности системы прогнозирования культур для точного земледелия с использованием классификатора ближайшего соседа на основе квадрата корреляции признаков

· Назад к списку

Почему важен более продуманный выбор культур

Для многих фермеров, особенно мелких земледельцев в таких странах, как Индия, выбор культуры для посева часто воспринимается как риск. Колебания погоды, изменения осадков и состояние почвы влияют на то, выживет ли культура и даст ли хороший урожай. В этом исследовании рассматривается, как данные и простые инструменты искусственного интеллекта могут убрать часть неопределённости из этого решения, помогая фермерам надёжнее и более выгодно подбирать культуры под местные условия.

Земледелие, основанное на данных, а не на догадках

Современное точное земледелие использует датчики, метеорологические записи и анализы почвы, чтобы детально отслеживать условия выращивания. Вместо того чтобы полагаться лишь на опыт или традиции, фермеры получают численные показатели питательных веществ в почве, температуры, влажности и осадков. Однако большинство существующих компьютерных систем, превращающих эти измерения в рекомендации по культурам, упускают из виду то, как факторы взаимодействуют друг с другом. Например, лучшая культура может зависеть не только от количества осадков или содержания азота, но и от их конкретного сочетания. Игнорирование таких взаимосвязей приводит к менее точным прогнозам и упущенным возможностям получения более высокого урожая.

Figure 1
Figure 1.

Поиск закономерностей во взаимодействии полевых условий

Авторы предлагают новый способ зафиксировать, как различные полевые условия изменяются взаимосвязанно. Они начинают с очистки и масштабирования всех измерений в наборе данных по культурам, чтобы ни один фактор не доминировал лишь из-за больших чисел. Затем они строят так называемый «квадрат корреляции признаков» — по сути сетку, показывающую для каждой пары измерений, склонны ли они повышаться и понижаться вместе или двигаться в противоположных направлениях. Сильные положительные связи в этой сетке означают, что два показателя часто идут рука об руку; отрицательные связи — что они обычно расходятся. Эта карта отношений служит компактным резюме поведения конкретного набора полевых условий.

Дать слово похожим случаям при выборе культуры

Когда эти взаимосвязи захвачены, система использует простую, но эффективную идею: найти прошлые ситуации, похожие на текущую, и применить культуру, которая там дала лучший результат. Для этого применяется метод, называемый классификатором ближайших соседей. Каждая запись в историческом наборе данных содержит и измеренные условия, и фактически выращенную культуру. Для новой фермерской ситуации система оценивает, насколько она «близка» к каждому прошлому случаю на основе признаков, информированных корреляцией, и выбирает небольшую группу наиболее схожих записей. Эти ближайшие соседи затем «голосуют» за наиболее подходящую культуру. Тщательная настройка числа соседей позволяет авторам сбалансировать устойчивость прогноза и чувствительность к шуму в данных.

Figure 2
Figure 2.

Тестирование на реальных данных рекомендаций по культурам

Чтобы оценить эффективность метода, исследователи протестировали его на общедоступном наборе данных рекомендаций по культурам, собранном в Индии. Данные включают семь ключевых признаков: потребность в азоте, фосфоре и калии; температуру; влажность; pH почвы; и количество осадков. Набор охватывает двадцать две разные культуры — от основных зерновых, таких как рис и кукуруза, до фруктов, например манго и папайи, а также волокнистых и плантационных культур, таких как хлопок и кофе. Поскольку набор данных идеально сбалансирован и содержит одинаковое число примеров для каждой культуры, он служит честной площадкой для сравнения различных компьютерных моделей.

Превосходство над устоявшимися методами прогнозирования

Новый подход, названный FCSNN, сравнивали с несколькими широко используемыми методами машинного обучения, включая деревья решений, случайный лес, логистическую регрессию, наивный Байес, градиентный бустинг и стандартную модель ближайших соседей. По нескольким показателям производительности FCSNN стабильно опережал остальные. Он правильно определял наиболее подходящую культуру почти в 98% случаев, а его уровень ошибок оказался самым низким среди всех протестированных методов. Интересно, что и другие модели улучшали результаты, когда им подавали признаки, сформированные на основе квадрата корреляции, что подчёркивает важность учёта взаимодействия полевых условий, а не рассмотрения каждого фактора по отдельности.

Что это значит для фермеров

Для неспециалистов вывод прост: уделяя внимание тому, как факторы почвы и погоды сочетаются, а не только их отдельным значениям, компьютеры могут давать значительно более надёжные рекомендации о том, какую культуру выращивать. Система FCSNN показывает, что даже относительно простые приёмы искусственного интеллекта, при аккуратной разработке, способны существенно улучшить прогнозирование культур. На практике такой инструмент можно связать с недорогими датчиками на полях или региональными сервисами данных, предоставляя фермерам своевременные рекомендации, привязанные к месту. Хотя в этом исследовании использовались исторические данные, в будущем в систему можно подключать живые показания с полей, превращая сложные экологические паттерны в понятные и практичные решения по посеву.

Цитирование: Kindra, K., Bhuvaneswari Amma, N.G. & Nageswari Amma, N.G. Towards enhancing the performance of crop prediction system for precision agriculture using feature correlation square-based nearest neighbor classifier. Sci Rep 16, 8807 (2026). https://doi.org/10.1038/s41598-026-35212-2

Ключевые слова: точное земледелие, рекомендация культуры, машинное обучение, данные почвы и погоды, малые фермерские хозяйства