地球科学中的大数据分析与挖掘算法手册
上QQ阅读APP看书,第一时间看更新

1.2 FP-growth算法

1.2.1 算法概要

FP-growth算法是韩家炜等人在2000年提出的关联规则挖掘算法。它采取如下分治策略:将提供频繁项集的数据库压缩到一棵频繁模式树(FP-tree),但仍保留项集关联信息,然后,通过遍历频繁模式树,找到所有的频繁项目集[2]。FP-growth算法作为数据挖掘中一个较为基础的算法,已在大多数商业及开源的数据挖掘软件包中实现,例如IBM Intelligent Miner(IBM数据挖掘工具)、SAS Enterprise Miner、SGI MineSet、Clementine(SPSS)、R-Programming、ELKI以及Weka等。