頻繁項集挖掘算法——FP-growth算法

        上一篇咱們介紹了Apriori算法,可是咱們能夠分析得出,Apriori算法可能收到兩種非平凡開銷的影響:它可能須要產生大量候選項集;它可能須要重複的掃描整個數據庫,經過模式匹配檢查一個很大的候選集合。檢查數據庫中每一個事務來肯定候選項集支持度的開銷很大。算法         是否能夠設計一種方法,挖掘所有頻繁項集而無須這種代價昂貴的候選產生過程?一種試圖這樣作的方法稱爲頻繁模式增
相關文章
相關標籤/搜索