Clear Sky Science · ja
クラス不均衡問題のための木の刈り込みと再サンプリング
スマートな予測で稀な事例が重要な理由
人工知能に支えられた多くの意思決定は、稀な事象を見つけることに依存しています:不正なクレジットカード利用、疾患の早期兆候、機械の危険な故障などです。こうした状況では、重要な事例は通常の事例よりもはるかに少なく、大半の学習アルゴリズムはそれらを無視してしまいがちです。本稿では、広く使われる手法であるランダムフォレストを、こうした稀で重要な事例に対してより敏感にする方法――しかもモデルをよりスリムで高速にする手法――を紹介します。
キーワード: クラス不均衡, ランダムフォレスト, リサンプリング, 機械学習, アンサンブル手法