Clear Sky Science · zh

一种用于挖掘最大容错频繁项集的模式增长方法

· 返回目录

在混乱数据中发现可靠模式

购物记录、医疗日志和传感器读数很少是完美的。条码可能被漏扫,传感器会失效,点击可能未被记录。然而企业和科学家仍然希望知道哪些事物会可靠地一起出现——例如产品组合、症状簇或欺诈的预警信号。本文提出了一种新方法,可以从这样的噪声数据中发现强烈重复出现的组合,同时将报告的模式数量保持得小且易于管理。

引用: Bashir, S. A pattern-growth approach for mining maximal fault-tolerant frequent itemsets. Sci Rep 16, 14556 (2026). https://doi.org/10.1038/s41598-026-44941-3

关键词: 频繁项集挖掘, 容错模式, 有噪事务数据, 模式增长算法, FP-tree