機器學習(二十三)——常見算法(關聯、相似、TF-IDF等)

1) Apriori算法: 通過apriori算法來實現頻繁項集的查詢: 支持度:數據集中包含該項集記錄所佔的比例,上例中{豆奶}的支持度=2/5,{啤酒,尿布}的支持度=3/5。 置信度:針對像頻繁集數量>=2的情況,例如{啤酒,尿布},那麼置信度=支持度({尿布,啤酒})/支持度(尿布)。 置信度的順序對結果存在影響:          兩個公式的結果未必一致。 需要注意的是,b和a的位置不同
相關文章
相關標籤/搜索