獲取聚類結果中每一類的數據,該數據類型是DataFramespa
思路:獲取clf_KMeans的標籤,我這裏是聚三類,標籤就是0,1,2code
將Label轉成Series類型,再篩選出指定標籤的res0,我篩選了1blog
最後在DataFrame裏獲取Label爲1的數據pandas
import pandas as pd
from sklearn.cluster import KMeans
# 創建模型。n_clusters參數用來設置分類個數,即K值,這裏表示將樣本分爲兩類。 clf_KMeans = KMeans(n_clusters=3, max_iter=10) # 模型訓練。獲得預測值。 print "clf_KMeans聚類中心\n", (clf_KMeans.cluster_centers_) quantity = pd.Series(clf_KMeans.labels_).value_counts() print "cluster2聚類數量\n", (quantity) #獲取聚類以後每一個聚類中心的數據 res0Series = pd.Series(clf_KMeans.labels_) res0 = res0Series[res0Series.values == 1] print"類別爲1的數據\n",(df.iloc[res0.index])
另一種方法,更簡潔it
res = dataframe[(clf_KMeans.labels_ == 1)]