Standford機器學習 聚類算法(clustering)和非監督學習(unsupervised Learning)

聚類算法是一類非監督學習算法,在有監督學習中,學習的目標是要在兩類樣本中找出他們的分界,訓練數據是給定標籤的,要麼屬於正類要麼屬於負類。而非監督學習,它的目的是在一個沒有標籤的數據集中找出這個數據集的結構把它自動聚成兩類或者多類。   本講主要介紹了最常用了一種聚類算法--K-means聚類算法。如果將數據集分成兩類,即k=2,K-means算法過程如下: 1、首先任意選取兩個不同的樣本作爲兩類樣
相關文章
相關標籤/搜索