ECLAT(Equivalence Class Transformation):通常的數據庫是根據項ID和項值來存儲的,這裏的主要思想是把惟一的項值提出來,對應列放在數據庫中的項ID列表。
此時,當前項的頻率就是ID列表的大小,若是要看兩個項的頻率就是求IDlist的交集。 這種存儲具有以下的特徵:若是idlist如出一轍,表明這兩項確定是一塊兒出現;若是x的ID列表是Y的ID列表的子集,那麼擁有X項的記錄一定擁有Y
hash較少表明集數量
對全部k集頻繁項作hash計算,hash表中存儲計算結果爲同一個hash值的個數【能夠在具體的分區作】,若是這個數值小於support值,那麼當前hash桶中的全部項都不是頻繁的,就不會當作表明集頻繁模式挖掘-DHP算法詳解 | I am Busyui