數據挖掘筆記-關聯規則-FPGrowth-2

前面是單機版的實現,如今經過MapReduce來實現FPGrowth算法,主要用了兩個MR,具體過程以下:java 一、第一個MR掃描全部數據集統計數據集中的頻繁一項集,即每一個項的出現次數。git 二、讀取第一個MR產生的文件,對頻繁一項集排序,而後上傳到HDFS上。github 三、第二個MR掃描全部數據集,並根據第二步產生的排序好的頻繁一項集來得出頻繁項集。算法 第二個MR的Map階段過程:
相關文章
相關標籤/搜索