FP-growth算法發現頻繁項集(一)——構建FP樹

  常見的挖掘頻繁項集算法有兩類,一類是Apriori算法,另外一類是FP-growth。Apriori經過不斷的構造候選集、篩選候選集挖掘出頻繁項集,須要屢次掃描原始數據,當原始數據較大時,磁盤I/O次數太多,效率比較低下。FPGrowth不一樣於Apriori的「試探」策略,算法只需掃描原始數據兩遍,經過FP-tree數據結構對原始數據進行壓縮,效率較高。html   FP表明頻繁模式(Fre
相關文章
相關標籤/搜索