from sklearn.datasets import make_blobs from matplotlib import pyplot # create test data sets datas, targets = make_blobs( n_samples=100, #樣本數量 n_features=2, #樣本特徵數 centers=3, #中心數量 cluster_std=[0.5, 1.0, 1.5], #方差 center_box=(-20.0, 20.0), shuffle=True, random_state=None ) pyplot.scatter(datas[:,0],datas[:,1],c=targets) pyplot.show()
km = KMeans(n_clusters=3, random_state=10)#建立模型(幾個羣組,隨機種子數) km.fit(datas, targets)#計算聚類 y_hat = km.predict(datas)#給這個樣本估計最接近的分組(簇) ''' ret = km.fit_predict(datas) #返回一個給數據每一項分組的組號列表 print km.get_params()#獲取參數信息 km.set_params(keyname=value) '''
其餘經常使用函數
python