【頻繁項集挖掘】FP-growth算法原理

FP-growth,FP表示frequent pattern。它通過在內存中構建FP-tree,減少了描述數據庫的次數,減少了候選頻繁項集的個數。FP-tree主要通過前綴共享的樹結構方式,尋找頻繁項。FP-tree其實是一棵前綴樹,按支持度降序排列,支持度越高的頻繁項離根節點越近,從而使得更多的頻繁項可以共享前綴。   1. 問題定義 圖1 購物籃數據的二元表示   圖1表示顧客的購物籃數據,其
相關文章
相關標籤/搜索