Spark Mllib之頻繁模式挖掘--基於RDD

微信公衆號:數據挖掘與分析學習java 挖掘頻繁項,項集,子序列或其餘子結構一般是分析大規模數據集的第一步,這是數據挖掘多年來一直活躍的研究課題。spark.mllib提供了FP-growth的並行實現,這是一種挖掘頻繁項集的流行算法。算法 1.FP-growth  Han et al., Mining frequent patterns without candidate generation這
相關文章
相關標籤/搜索