數據挖掘筆記-關聯規則-FPGrowth-2

時間 2020-05-08

標籤數據挖掘筆記關聯規則 fpgrowth 简体版

原文原文鏈接

前面是單機版的實現，如今經過MapReduce來實現FPGrowth算法，主要用了兩個MR,具體過程以下：java 一、第一個MR掃描全部數據集統計數據集中的頻繁一項集，即每一個項的出現次數。git 二、讀取第一個MR產生的文件，對頻繁一項集排序，而後上傳到HDFS上。github 三、第二個MR掃描全部數據集，並根據第二步產生的排序好的頻繁一項集來得出頻繁項集。算法第二個MR的Map階段過程：

>>阅读原文<<