關聯規則FpGrowth算法

上一篇介紹了關聯規則挖掘的一些基本概念和經典的Apriori算法,Aprori算法利用頻繁集的兩個特性,過濾了很多無關的集合,效率提高不少,但是我們發現Apriori算法是一個候選消除算法,每一次消除都需要掃描一次所有數據記錄,造成整個算法在面臨大數據集時顯得無能爲力。今天我們介紹一個新的算法挖掘頻繁項集,效率比Aprori算法高很多。 FpGrowth算法通過構造一個樹結構來壓縮數據記錄,使得挖
相關文章
相關標籤/搜索