Clear Sky Science · ru
Новая гибридная глубокая модель для прогнозирования оттока клиентов с использованием RFM и кластеризации эмбеддингов
Почему важно удерживать онлайн-покупателей
Каждый интернет-магазин сталкивается с одним и тем же вопросом: какие клиенты незаметно утекают, а какие с большой вероятностью вернутся? Ранняя идентификация позволяет компаниям тратить меньше на привлечение новых покупателей и больше — на удержание существующих. В этом исследовании показан подход, основанный на данных, который выявляет клиентов из группы риска, превращая неструктурированные истории кликов и покупок в понятные сигналы о том, что человек собирается прекратить покупки.

Анализ того, как часто и сколько люди покупают
Авторы исходят из простой идеи, известной многим маркетологам: клиенты различаются по тому, как недавно они покупали, как часто совершают покупки и сколько тратят. Эти три показателя — рецентность, частота и денежная ценность (recency, frequency, monetary value) — рисуют базовую картину каждого покупателя. Те, кто покупает часто, тратит больше и делал покупки недавно, обычно более лояльны. Те, кто долго не совершал покупок, делает это редко и тратит мало, с большей вероятностью уйдут. В исследовании эти три сигнала, а также несколько дополнительных статистик на основе времени используются как основа для дальнейшего анализа.
Группировка покупателей по похожим привычкам
Вместо того чтобы рассматривать всех клиентов как единую массу, исследователи сначала разбивают их на сегменты по поведению. Они применяют технику глубокого обучения, которая сжимает профиль покупок каждого клиента в компактный код, а затем автоматически формирует кластеры в этом кодовом пространстве. Это позволяет обнаружить закономерности, которые сложно заметить простыми правилами, например тонкие различия между стабильными регулярными покупателями, сезонными покупателями и теми, кто постепенно отдаляется. Полученные кластеры соответствуют реальным бизнес-смыслам: в одних группах почти одни лояльные клиенты, в других — высокая доля тех, кто близок к уходу.

Обучение системы отслеживать путь клиента во времени
После группировки клиентов эти сегменты вместе с паттернами расходов подаются в нейронные сети, хорошо работающие с последовательностями. Эти сети изначально создавались для чтения предложений или звука, но здесь они читают потоки событий покупок. Они учатся тому, как активность человека меняется в течение недель или месяцев и к чему обычно приводят эти изменения — к продолжению покупок или к молчанию. Исследователи тренируют и тестируют свои модели на двух сильно разных реальных наборах данных: одном из традиционных записей о покупках и другом, собранном из подробных логов кликов и событий.
Сравнение новых методов с привычными инструментами
Далее команда сравнивает свой гибридный подход с классическими инструментами, такими как логистическая регрессия и опорные векторные машины. Простые модели показывают хорошие результаты, когда данные уже упорядочены, но испытывают трудности при сложном или шумном поведении. В отличие от них, новая структура сначала преобразует данные через глубокую кластеризацию, а затем улавливает временные закономерности с помощью последовательных сетей. На обоих наборах данных такая схема достигает высокой точности, оставаясь при этом сбалансированной между обнаружением уходящих клиентов и минимизацией ложных тревог. Абляционный анализ показывает, что добавление шага кластеризации заметно повышает качество по сравнению с использованием только последовательных моделей.
Что это значит для онлайн-бизнеса
Для неспециалиста главный вывод заключается в том, что более богатое использование данных о том, когда и как люди делают покупки, может превратить рутинные логи в ранние предупреждения о тех, кто с высокой вероятностью уйдёт. Объединив простые сводки расходов, интеллектуальную группировку клиентов и модели, отслеживающие поведение во времени, предложенная методика даёт более надёжный способ пометить клиентов из группы риска. Компании затем могут сосредоточить акции по удержанию, поддержку или персонализированный контент на тех, кто действительно нуждается во внимании, повышая лояльность без догадок и опоры лишь на интуицию.
Цитирование: Ibrahim, S., Tawfik, B.S., Makhlouf, M.A. et al. A novel hybrid deep learning framework for customer churn prediction using RFM and embedding clustering. Sci Rep 16, 16563 (2026). https://doi.org/10.1038/s41598-026-53220-0
Ключевые слова: отток клиентов, электронная коммерция, сегментация клиентов, глубокое обучение, анализ RFM