【數據挖掘】FPgrowth算法筆記

1. 提出問題 對於Apriror算法來講,仍然受到兩種非平凡開銷的影響:web 仍然須要產生大量的候選集。例如,若是有10^4個頻繁1項集,則須要產生10^7個候選頻繁2項集。算法 可能須要重複地掃描整個數據庫。檢索數據庫中每一個事務來肯定候選項集支持度的開銷會很大。數據庫 因此,咱們須要設計一種方法,挖掘所有頻繁項集而無須這種代價昂貴的候選產生過程。即,不須要產生如此大量的候選集,同時在肯定候
相關文章
相關標籤/搜索