weka實戰004:fp-growth關聯規則算法

apriori算法的計算量太大,若是數據集略大一些,會比較慢,很是容易內存溢出。算法 咱們能夠算一下複雜度:假設樣本數有N個,樣本屬性爲M個,每一個樣本屬性平均有K個nominal值。數據庫 1. 計算一項頻繁集的時間複雜度是O(N*M*K)。分佈式 2. 假設具備最小支持度的頻繁項是q個,根據它們則依次生成一項頻繁集,二項頻繁集,....,r項頻繁集合,它們的元素數量分別是:c(q, 1), c
相關文章
相關標籤/搜索