【騰訊TMQ】機器學習之一:聚類實戰

導讀 可預見的未來數據分析和機器學習將成爲工作中必備技能,也許已經在某個項目中討論怎麼調參優化,就像過去討論如何優雅的寫python、如何避免C++內存泄露一樣常見。 一、簡單介紹聚類算法 1、聚類的定義 聚類就是對大量未知標註的數據集,按數據的內在相似性將數據集劃分爲多個類別,使類別內的數據相似度較大而類別間的數據相似度較小。 2、聚類的基本思想 給定一個有N個對象的數據集,構造數據的k個簇,k
相關文章
相關標籤/搜索