關聯規則、支持度(support)、置信度(confidence)、並運用Spark RDD計算

轉載請標明出處:小帆的帆的專欄html 例子: 總共有10000個消費者購買了商品, 其中購買尿布的有1000人, 購買啤酒的有2000人, 購買麪包的有500人, 同時購買尿布和啤酒的有800人, 同時購買尿布的麪包的有100人。web 關聯規則 關聯規則:用於表示數據內隱含的關聯性,例如:購買尿布的人每每會購買啤酒。算法 支持度(support) 支持度:{X, Y}同時出現的機率,例如:{尿
相關文章
相關標籤/搜索