Apriori算法

時間 2019-11-25

標籤 apriori 算法简体版

原文原文鏈接

感謝紅蘭整理的PPT，簡單易懂，如今將其中精彩之處整理，與你們分享。mysql

1、Apriori算法簡介： Apriori算法是一種挖掘關聯規則的頻繁項集算法，其核心思想是經過候選集生成和情節的向下封閉檢測兩個階段來挖掘頻繁項集。 Apriori（先驗的，推測的）算法應用普遍，可用於消費市場價格分析，猜想顧客的消費習慣；網絡安全領域中的入侵檢測技術；可用在用於高校管理中，根據挖掘規則能夠有效地輔助學校管理部門有針對性的開展貧困助學工做；也可用在移動通訊領域中，指導運營商的業務運營和輔助業務提供商的決策制定。算法

2、挖掘步驟：sql

1.依據支持度找出全部頻繁項集（頻度）數據庫

2.依據置信度產生關聯規則（強度）安全

3、基本概念網絡

對於A->B.net

①支持度：P(A ∩ B)，既有A又有B的機率網絡安全

②置信度：事件

P(B|A)，在A發生的事件中同時發生B的機率 p(AB)/P(A) 例如購物籃分析：牛奶 ⇒ 麪包get

例子：[支持度：3%，置信度：40%]

支持度3%：意味着3%顧客同時購買牛奶和麪包

置信度40%：意味着購買牛奶的顧客40%也購買麪包

③若是事件A中包含k個元素，那麼稱這個事件A爲k項集事件A知足最小支持度閾值的事件稱爲頻繁k項集。