sparkmllib關聯規則算法(FPGrowth,Apriori)

關聯規則算法的思想就是找頻繁項集,經過頻繁項集找強關聯。 介紹下基本概念: 對於A->B 一、置信度:P(B|A),在A發生的事件中同時發生B的機率 p(AB)/P(A) 例如購物籃分析:牛奶 ⇒ 麪包 二、支持度:P(A ∩ B),既有A又有B的機率 假如支持度:3%,置信度:40% 支持度3%:意味着3%顧客同時購買牛奶和麪包 置信度40%:意味着購買牛奶的顧客40%也購買麪包 三、若是事件A
相關文章
相關標籤/搜索