數據挖掘算法DHP

前言: Apriori算法是關聯規則挖掘經典算法,但不適合在大型數據庫中挖掘關聯規則,時間太慢,許多學者提出了改進的算法。比如DHP算法。 DHP 1. 減少候選集數量 背景:這個操作是基於Ck來做的,我們知道原來的話,Ck的得到是通過L(k-1)*L(1)笛卡爾積連接,去掉k-1項集得到。同時,我們也知道其實Ck還是有很多都不是頻繁項集。 現在的目標就是:掃描一遍數據庫,將Ck候選集的數量留下1
相關文章
相關標籤/搜索