hadoop下實現kmeans算法——一個mapreduce的實現方法

寫mapreduce程序實現kmeans算法,咱們的思路多是這樣的java 1. 用一個全局變量存放上一次迭代後的質心web 2. map裏,計算每一個質心與樣本之間的距離,獲得與樣本距離最短的質心,以這個質心做爲key,樣本做爲value,輸出算法 3. reduce裏,輸入的key是質心,value是其餘的樣本,這時從新計算聚類中心,將聚類中心put到一個所有變量t中。apache 4. 在m
相關文章
相關標籤/搜索