數據挖掘 -- FP-Tree關聯規則算法

1. 算法原理 FP-Tree相對於Apriori算法,減小了I/O的次數,原理是先找到原數據的頻繁1項集,即項頭表。獲得後按照項頭表的sup值給初始表排序。而且建立樹形結構,每一個節點存節點名稱和出現次數。將初始表迭代放入樹中,建樹過程完成。挖掘過程是倒序遍歷項頭表,對於每一個s,尋找s在樹中到根的路徑,組合其他分支的s, 父節點的sup值爲全部s節點的sup值之和。獲得頻繁項集。最終求出最大頻
相關文章
相關標籤/搜索