Clear Sky Science · ja
カテゴリカルエンコーディングと標準スケーリングを用いたニューラルネットワークによる解約予測の高度化
顧客を維持する重要性
電話プランを解約したり、銀行口座を閉じたり、サブスクリプションをやめると、企業が「解約した」顧客と呼ぶ状態になります。新しい顧客を獲得する費用は既存顧客を維持するよりずっと高いため、企業は顧客が離れそうな初期の兆候を早く見つけたいと考えます。本研究は、慎重に設計されたニューラルネットワークという人工知能を用いて、銀行顧客のうち誰が離脱しそうかをより正確に予測し、企業が維持施策の予算をより賢く使えるようにする方法を探ります。
生の銀行記録を警告信号に変える
研究者たちは約1万件の銀行顧客の公開データセットを使い、年齢、国、口座残高、在籍期間、クレジットカードの保有やアクティブ利用の有無など十数の情報で各顧客を記述しました。ここでの中心的な課題は、これらの情報が異なる形式で提供されることです:給与のような数値、国のようなカテゴリ、そして実際に離脱する顧客の割合が比較的小さいことです。チームは2つのしばしば見落とされがちだが重要な前処理—カテゴリ情報を数値に変換する方法(カテゴリカルエンコーディング)と、数値フィールドを比較可能なスケールに揃える方法(標準スケーリング)—に注力し、それらの後にすべてをニューラルネットワークに入力しました。

データの洗浄とバランス調整
公正な予測を行うために、まずデータを洗浄する必要がありました。欠損値や異常な外れ値は処理され、国などのカテゴリ情報はワンホットエンコーディングという手法で変換されました。これは各カテゴリを任意の数値ラベルではなく、単純なはい/いいえのフラグ群として表現するものです。同時に、クレジットスコアや口座残高といった数値は標準化され、特定の大きな値を持つフィールドが学習過程を支配しないようにしました。離脱する顧客は残る顧客より少ないため、チームは訓練手順も調整し、解約者に対する誤予測により重みを与えることで、ネットワークが少数派に注意を向けるようにしました。
リスクのある顧客を見抜くネットワークの教育
この準備済みデータの上で、著者たちは約30の入力特徴をいくつかの隠れ層で処理する多層ニューラルネットワークを構築しました。各層は入力の重み付き和に簡単な非線形関数を適用し、残高、在籍期間、利用状況といった要素が連動して離脱確率に与える微妙な相互作用を捉えられるようにします。訓練は厳格なクロスバリデーションの枠組みで行われ、データセットを繰り返し訓練用とテスト用に分割することで、モデルの性能が単に記憶しているだけでなく新しい顧客にどれだけ一般化できるかを反映するようにしました。システムの出力は各顧客の解約確率、すなわち銀行が介入できるリスクスコアです。

実務でのモデル性能
ニューラルネットワークは高い全体精度を達成し、特に高い精密度(precision)を示しました:予測上の解約者と判定した顧客の5人中4人以上が実際にリスクを抱えていました。これは、銀行が高価な維持オファーを比較的少数の顧客に自信を持って集中できることを意味し、本来残っていたであろう多数の顧客に無駄遣いすることを避けられます。モデルは一部の解約者を見逃す(リコールは控えめ)こともありますが、忠実な顧客を誤って離反リスクとラベル付けすることは稀であり、インセンティブや勧誘キャンペーンが高コストである場面では重要です。ランダムフォレスト、勾配ブースティング、ロジスティック回帰といった他の一般的手法と比較しても、提案されたニューラルネットワークはランキングや識別の主要指標で同等かそれ以上の成績を示し、とくに誤警報の最小化で際立ちました。
離脱の要因と銀行の対応策
生のスコアに加え、著者たちはモデルが重視した要因を調べました。口座残高と「アクティブメンバー」であるかどうかが主要なシグナルであり、クレジットカード保有、国、年齢も重要な役割を果たしていることが分かりました。言い換えれば、財務的な関与や日常的な利用の兆候が忠誠度に対する強い手がかりとなります。チームはモデルの挙動が国や性別ごとにどう違うか、リスクスコアが実際の解約率とどう一致するかも検証しました。その結果、低〜中リスクの顧客では確率の較正が良好であり、モデルは利益を最大化するターゲット化されたキャンペーン設計に使えることが示されました:上位10〜30%の高リスク顧客に焦点を当てると最も大きな財務的リターンが得られ、それを超えて追加的に働きかけると費用が節約を上回り始めます。
日常サービスへの示唆
簡潔に言えば、本研究はデータの準備方法—特にカテゴリを数値に変換し、すべての特徴を共通のスケールに揃えること—に細心の注意を払うことで、ニューラルネットワークが誰がサービスを離れるかを予測する上でずっと信頼できるツールになり得ることを示しています。得られたモデルは単に理論上の良好なスコアにとどまらず、銀行や似た事業者が実際に介入すべき本当にリスクの高い顧客を特定し、無駄なキャンペーンを避ける実用的な手段を提供します。解約の最も影響力のあるシグナルを明らかにし、予測が直接利益と結びつくことを示したことで、解約予測は純粋に技術的な演習から、企業が顧客を長く維持するのに役立つ意思決定ツールへと前進しました。
引用: Bhattacharjee, B., Madhu, U., Guha, S.K. et al. Neural network approach enhancing churn prediction with categorical encoding and standard scaling. Sci Rep 16, 6274 (2026). https://doi.org/10.1038/s41598-026-37407-z
キーワード: 顧客解約, ニューラルネットワーク, 銀行分析, 機械学習, 顧客維持