單機和集羣環境下的FP-Growth算法java實現(關聯規則挖掘)

1 FP-Growth簡要描述      和Apriori算法同樣,都是用於關聯規則挖掘的算法。Apriori算法每生成一次k頻繁項集都須要遍歷一次事務數據庫,當事務數據庫很大時會有頻繁的I/O操做,所以只適合找出小數據集的頻繁項集;而FP-Growth算法整個過程當中,只有兩次掃描事務數據庫,一次發生在數據預處理(包括去掉事務的ID編號、合併相同事務等),另外一次發生在構造FP-Tree的頭項表
相關文章
相關標籤/搜索