機器學習之KMeans聚類

零、學習生成測試數據


from sklearn.datasets import make_blobs
from matplotlib import pyplot

#  create test data sets
datas, targets = make_blobs(
    n_samples=100, #樣本數量
    n_features=2, #樣本特徵數
    centers=3, #中心數量
    cluster_std=[0.5, 1.0, 1.5], #方差
    center_box=(-20.0, 20.0),
    shuffle=True,
    random_state=None
)

pyplot.scatter(datas[:,0],datas[:,1],c=targets)
pyplot.show()

1、創建模型


km = KMeans(n_clusters=3, random_state=10)#建立模型(幾個羣組,隨機種子數)
km.fit(datas, targets)#計算聚類
y_hat = km.predict(datas)#給這個樣本估計最接近的分組(簇)
'''
ret = km.fit_predict(datas) #返回一個給數據每一項分組的組號列表
print km.get_params()#獲取參數信息
km.set_params(keyname=value)
'''


其餘經常使用函數
python

2、KMeans算法原理

相關文章
相關標籤/搜索