FP-growth算法(一)——通過構建FP樹發現頻繁項集

  常見的挖掘頻繁項集算法有兩類,一類是Apriori算法,另一類是FP-growth。Apriori通過不斷的構造候選集、篩選候選集挖掘出頻繁項集,需要多次掃描原始數據,當原始數據較大時,磁盤I/O次數太多,效率比較低下。FPGrowth不同於Apriori的「試探」策略,算法只需掃描原始數據兩遍,通過FP-tree數據結構對原始數據進行壓縮,效率較高。   FP代表頻繁模式(Frequent
相關文章
相關標籤/搜索