Clear Sky Science · ru

Прогнозирование производства томатов в крупнейших азиатских странах-производителях: сравнительное исследование ARIMA, экспоненциального сглаживания, score-driven моделей и XGBoost

· Назад к списку

Почему важны будущие урожаи томатов

Томаты — неотъемлемая часть кухни по всей Азии: от уличной еды до соусов на полках супермаркетов. За каждым томатом стоит цепочка фермеров, рынков и политических решений, которые могут быть потрясены плохой погодой или колебаниями цен. В этом исследовании ставится простой, но жизненно важный вопрос: как лучше прогнозировать будущие урожаи томатов в ключевых азиатских странах, чтобы фермеры, власти и потребители не оказались застигнутыми врасплох?

Томаты, фермеры и еда на столе

Томаты — одна из наиболее производимых и торгуемых культур в мире, уступающая по объему лишь картофелю. Они богаты витаминами и антиоксидантами и поддерживают крупную перерабатывающую промышленность, превращающую их в сок, суп, пасту и соусы. В Азии Китай и страны Южной Азии вместе дают значительную долю мирового производства томатов, и миллионы мелких фермеров зависят от этой культуры как источника дохода. Когда урожаи колеблются, меняются доходы сельского хозяйства и цены для потребителей, что может угрожать как сельским средствам к существованию, так и продовольственной безопасности городов.

Рост урожаев и неравномерный рост

Исследователи проанализировали шестидесятилетний ряд данных о годовом производстве томатов с 1961 по 2021 год для Бангладеш, Китая, Индии, Пакистана и Шри-Ланки. Китай показал драматический рост, особенно после 2000 года, превратившись из скромного производителя в гиганта с десятками миллионов тонн в год. Индия также значительно расширила производство, хотя и более поступенно. Напротив, Бангладеш, Пакистан и Шри-Ланка демонстрировали более мягкий рост с периодическими всплесками и спадениями. Эти различия важны: страны с быстрым структурным ростом нуждаются в моделях, способных отслеживать долгосрочные восходящие тренды, тогда как другие требуют инструментов, фиксирующих стабильность или медленные изменения.

Figure 1. Как более точные прогнозы связывают азиатские томатные фермы с устойчивыми поставками продовольствия в города.
Figure 1. Как более точные прогнозы связывают азиатские томатные фермы с устойчивыми поставками продовольствия в города.

Испытание инструментов прогнозирования

Чтобы выяснить, какие методы лучше предсказывают будущее производство, команда сравнила четыре типа моделей. Две из них принадлежат классической статистике и ориентируются на плавные закономерности и тренды во времени. Еще одна, называемая score-driven подходом, позволяет ключевым компонентам модели постепенно менять свои значения по мере поступления новых данных, что дает адаптацию к изменяющимся условиям. Четвертый инструмент, известный как XGBoost, — популярный метод машинного обучения, объединяющий множество деревьев решений для захвата сложного и нерегулярного поведения данных. Исследователи обучали все четыре метода на данных с 1961 по 2014 годы, а затем тестировали их прогнозы на период 2015–2021 годов.

Краткосрочная точность против долгосрочной правдоподобности

В этих тестах XGBoost часто показал наименьшие ошибки, особенно в годы с высокой волатильностью производства. Это означает, что он хорошо улавливал недавние подъемы и спады. Однако авторы подчеркивают важный недостаток: модели на основе деревьев решений испытывают трудности при проекции значений за пределы того, что они уже видели. Для культур, таких как томаты в Индии и Бангладеш, где производство десятилетиями росло, этот недостаток проявляется в нереалистично плоских прогнозах. Классические методы, напротив, изначально созданы для продолжения внутренних трендов в будущее, даже если в краткосрочной перспективе они менее эффектны.

Figure 2. Как разные инструменты прогнозирования превращают исторические данные по урожаю томатов в модели будущего роста для каждой страны.
Figure 2. Как разные инструменты прогнозирования превращают исторические данные по урожаю томатов в модели будущего роста для каждой страны.

Выбор подходящего инструмента для каждой страны

Учитывая и точность, и правдоподобность, авторы тщательно выбрали по одной «практичной» модели для каждой страны. Для Бангладеш они выбрали метод экспоненциального сглаживания, который мягко продолжает долгосрочный восходящий тренд, при этом реагируя на недавние шоки. Для Китая, Индии, Пакистана и Шри-Ланки были выбраны score-driven модели, способные отслеживать меняющиеся темпы роста без ограничения, присущего деревьям решений. С помощью этих моделей они спрогнозировали производство томатов до 2028 года. Результаты указывают на то, что в Бангладеш, Китае, Индии и Пакистане, вероятно, сохранится рост урожаев томатов, в то время как производство на Шри-Ланке ожидается с выравниванием и лишь незначительным увеличением.

Что это значит для продовольственного планирования

Для неспециалистов главный вывод заключается в том, что более точные прогнозы томатов могут поддержать более взвешенные решения по всей продовольственной цепочке. Показав, что некоторые продвинутые методы машинного обучения превосходны в моделировании краткосрочной волатильности, но ошибаются при продлении долгосрочных трендов, исследование предостерегает от полагания исключительно на один тип модели. Его прогнозы по каждой стране дают более ясное представление о том, как может развиваться предложение томатов до 2028 года, помогая планировщикам подготовиться к растущему спросу, фермерам — правильно инвестировать, а рынкам — смягчать ценовые всплески.

Цитирование: Al khatib, A.M.G., Alshaib, B.M., Mishra, P. et al. Forecasting tomato production in major Asian producers: a comparative study of ARIMA, exponential smoothing, score-driven models, and XGBoost. Sci Rep 16, 15722 (2026). https://doi.org/10.1038/s41598-026-46110-y

Ключевые слова: производство томатов, прогнозирование урожая, модели временных рядов, машинное обучение в сельском хозяйстве, продовольственная безопасность в Азии