六 關聯分析:基本概念和算法1

啤酒尿布問題 6.1 問題定義 二元表示: 項集、事務和支持度計數:包含0個或多個項的集合被稱爲項集,k-項集;真實存在的項集稱爲事務;包含特定項集的事務個數稱爲項集的支持度計數。 關聯規則:蘊含表達式X->Y 關聯規則的強度:支持度和置信度,支持度可以用於給定數據集的頻繁程度,置信度確定Y包含X的事務中出現的頻繁程度。 關聯規則挖掘問題的形式化描述: 6.2 頻繁項集的產生 候選項集,通過比較候
相關文章
相關標籤/搜索