Clear Sky Science · zh
一种用于挖掘最大容错频繁项集的模式增长方法
在混乱数据中发现可靠模式
购物记录、医疗日志和传感器读数很少是完美的。条码可能被漏扫,传感器会失效,点击可能未被记录。然而企业和科学家仍然希望知道哪些事物会可靠地一起出现——例如产品组合、症状簇或欺诈的预警信号。本文提出了一种新方法,可以从这样的噪声数据中发现强烈重复出现的组合,同时将报告的模式数量保持得小且易于管理。
关键词: 频繁项集挖掘, 容错模式, 有噪事务数据, 模式增长算法, FP-tree
Clear Sky Science · zh
购物记录、医疗日志和传感器读数很少是完美的。条码可能被漏扫,传感器会失效,点击可能未被记录。然而企业和科学家仍然希望知道哪些事物会可靠地一起出现——例如产品组合、症状簇或欺诈的预警信号。本文提出了一种新方法,可以从这样的噪声数据中发现强烈重复出现的组合,同时将报告的模式数量保持得小且易于管理。
关键词: 频繁项集挖掘, 容错模式, 有噪事务数据, 模式增长算法, FP-tree