單機和集羣環境下的FP-Growth算法java實現(關聯規則挖掘)

時間 2020-05-08

標籤單機集羣環境 growth 算法 java 實現關聯規則挖掘欄目負載均衡简体版

原文原文鏈接

1 FP-Growth簡要描述和Apriori算法同樣，都是用於關聯規則挖掘的算法。Apriori算法每生成一次k頻繁項集都須要遍歷一次事務數據庫，當事務數據庫很大時會有頻繁的I/O操做，所以只適合找出小數據集的頻繁項集；而FP-Growth算法整個過程當中，只有兩次掃描事務數據庫，一次發生在數據預處理（包括去掉事務的ID編號、合併相同事務等），另外一次發生在構造FP-Tree的頭項表

>>阅读原文<<