換個角度思考問題——頻繁項集挖掘的兩個優化策略

在以前的博客中介紹過數據挖掘的一個基本問題頻繁項集挖掘。對於這一問題,有很多不同思想的算法。同時,也有一些優化策略可以在算法基本不變的情況下大大提高算法的效率。今天介紹兩個:豎向數據庫(Vertical database)、Diffsets 兩個策略非常相像,都是換了一個角度處理數據,巧妙而有效率。 Vertical mining  爲了說明這一策略,我用AprioriTID算法和Apriori做
相關文章
相關標籤/搜索