數智時代,大數據分析的幾個核心概念

3.大數據分析的幾個核心概念 3.1K―平均算法 K―平均算法是一種得到廣泛應用的基於劃分的聚類算法。其把M個對象分爲N個簇,使得每個簇內具有較高的相似度。 在應用該算法進行數據分析時,首先應輸入包含M個對象的數據集A以及簇的數目N。從A中任意選擇N個對象作爲初始簇中心並且不斷重複,隨後計算出簇中對象的均值,將每個對象分配到最相似的簇並且不斷更新簇均值,最後計算準則函數直到其不再發生變化爲止。因爲
相關文章
相關標籤/搜索