Clear Sky Science · zh
修剪树木森林与重采样以应对类别不平衡问题
为何稀有案例在智能预测中至关重要
许多由人工智能驱动的决策依赖于识别稀有事件:信用卡欺诈、疾病的早期迹象或机器中的危险故障。在这些情形下,重要的案例被普通案例大量掩盖,而大多数学习算法倾向于忽视它们。本文提出了一种方法,使一种流行方法——随机森林——对这些虽然罕见但至关重要的案例更加敏感,同时还能使模型更精简、运行更快。
关键词: 类别不平衡, 随机森林, 重采样, 机器学习, 集成方法
Clear Sky Science · zh
许多由人工智能驱动的决策依赖于识别稀有事件:信用卡欺诈、疾病的早期迹象或机器中的危险故障。在这些情形下,重要的案例被普通案例大量掩盖,而大多数学习算法倾向于忽视它们。本文提出了一种方法,使一种流行方法——随机森林——对这些虽然罕见但至关重要的案例更加敏感,同时还能使模型更精简、运行更快。
关键词: 类别不平衡, 随机森林, 重采样, 机器学习, 集成方法