Spark MLlib FPGrowth關聯規則算法

一.簡介   FPGrowth算法是關聯分析算法,它採取如下分治策略:將提供頻繁項集的數據庫壓縮到一棵頻繁模式樹(FP-tree),但仍保留項集關聯信息。在算法中使用了一種稱爲頻繁模式樹(Frequent Pattern Tree)的數據結構。FP-tree是一種特殊的前綴樹,由頻繁項頭表和項前綴樹構成。   相關術語:     1.項與項集       這是一個集合的概念,以購物車爲例,一件商品
相關文章
相關標籤/搜索