Clear Sky Science · ja

RFMと埋め込みクラスタリングを用いた顧客離反予測のための新しいハイブリッド深層学習フレームワーク

· 一覧に戻る

なぜオンライン購買者の維持が重要か

すべてのオンラインストアが直面する共通の問いはこれです:静かに離れていく顧客と、また戻ってくる可能性のある顧客をどう見分けるか。早期に把握できれば、新規顧客の獲得に過剰なコストをかける代わりに、既存顧客の維持に資源を集中できます。本研究は、散在するクリックや購入履歴を、顧客が購入を止めようとしていることを示す明確なシグナルに変えることで、リスクにある顧客を検出するデータ駆動の手法を提示します。

Figure 1. オンライン購買パターンの分析が、離反しやすい顧客と忠実な顧客をどう区別できるか。
Figure 1. オンライン購買パターンの分析が、離反しやすい顧客と忠実な顧客をどう区別できるか。

購買頻度と支出額の見方

著者らは、マーケターにとって既に馴染みのある単純な発想から出発します:顧客は、どれだけ最近買ったか(recency)、どれくらいの頻度で買うか(frequency)、そしてどれだけ支出するか(monetary)が異なります。これら3つの数値は、それぞれの購買者の基本的な姿を描きます。頻繁に買い、より多く支払い、最近購入がある人は通常忠誠心が高い。一方、長期間購入がなく、稀にしか買わず支出が少ない人は離脱しやすい。本研究ではこれら3つの指標に加え、いくつかの時間的統計量を基礎として以降の解析を行います。

似た行動を示す購買者のグルーピング

研究者たちは、すべての顧客を一括りに扱うのではなく、まず行動に基づくセグメントに分けます。各顧客の購買プロファイルを圧縮してコンパクトなコードに変換する深層学習手法を用い、そのコード空間で自動的にクラスタを形成します。これにより、単純なルールでは見つけにくいパターン、たとえば安定して定期的に買う層、季節的な購買者、徐々に離脱しつつある層の微妙な違いを捉えられます。得られたクラスタは実務上の意味と整合し、あるグループはほぼ忠実な顧客で占められ、別のグループは離反しそうな人の割合が高いという具合になります。

Figure 2. 段階的なモデルが購買イベントの連続をどのように正確な離反予測に変えるか。
Figure 2. 段階的なモデルが購買イベントの連続をどのように正確な離反予測に変えるか。

顧客の行動の時間的変化を追う仕組みの学習

顧客をグループ化した後、研究ではこれらのセグメントと支出パターンを時系列を扱うのに適したニューラルネットワークに入力します。これらのネットワークはもともと文章や音声の解釈のために設計されましたが、本研究では購買イベントの連続を読み取ります。週単位や月単位での活動の変化と、その変化が継続的な購買に結びつくのか沈黙に終わるのかを学習します。研究者らは、伝統的な購入記録から成るデータセットと、詳細なクリックやイベントログから構築した別のデータセットという、性質の異なる二つの実データでモデルの訓練と検証を行いました。

新手法と従来手法の比較

次に研究チームは、ハイブリッドアプローチをロジスティック回帰やサポートベクターマシンといった標準的手法と比較します。データが既に整っている場合、単純なモデルは良好に機能しますが、行動が複雑でノイズが多いと苦戦します。これに対して本フレームワークは、まず深層クラスタリングでデータの形を整え、その後順序モデルで時間的パターンを捉えます。両データセットにおいて、この構成は高い精度を達成しつつ、離反者を見つける力と誤検知のバランスを両立しました。アブレーション研究により、クラスタリング段階を加えることが順序モデル単独よりも明確に性能を向上させることが示されました。

オンライン事業者にとっての意味

非専門家向けに要約すれば、いつ・どのように人々が買うかというデータをより豊かに活用することで、日常的なログから離反しそうな顧客への早期警告を生み出せる、という点が主なメッセージです。単純な支出の要約、賢い顧客グルーピング、行動の時間的推移を追うモデルを組み合わせることで、リスクの高い顧客をより確実に特定できます。企業はそれによって、離脱防止のオファーやサポート、コンテンツを最も必要とする顧客に絞って提供し、勘や単なる直感に頼らずロイヤルティを向上させられます。

引用: Ibrahim, S., Tawfik, B.S., Makhlouf, M.A. et al. A novel hybrid deep learning framework for customer churn prediction using RFM and embedding clustering. Sci Rep 16, 16563 (2026). https://doi.org/10.1038/s41598-026-53220-0

キーワード: 顧客離反, eコマース, 顧客セグメンテーション, 深層学習, RFM分析