hadoop下實現kmeans算法——一個mapreduce的實現方法

時間 2020-08-13

標籤 hadoop 實現 kmeans 算法一個 mapreduce 方法欄目 Hadoop 简体版

原文原文鏈接

寫mapreduce程序實現kmeans算法，咱們的思路多是這樣的java 1. 用一個全局變量存放上一次迭代後的質心web 2. map裏，計算每一個質心與樣本之間的距離，獲得與樣本距離最短的質心，以這個質心做爲key，樣本做爲value，輸出算法 3. reduce裏，輸入的key是質心，value是其餘的樣本，這時從新計算聚類中心，將聚類中心put到一個所有變量t中。apache 4. 在m

>>阅读原文<<