機器學習-聚類之K-Means原理

聚類概念: 聚類屬於無監督問題:手裏沒有標籤 聚類實質是將相似的東西分到一組(簇) 難點在於參數的選擇和評估 因爲沒有真值 K-Means 基本概念 K值是需要人爲設定,即爲簇的個數 質心:均值即爲同一簇下所有點的均值 目標函數:用距離來度量 常用到歐式距離和餘弦相似度(需要對數據先標準化) Ci 爲簇的質心 K爲簇族數 實際工作流程: 參照下圖1 主要步驟順序爲 1.首先人爲先確定K值 該參數比
相關文章
相關標籤/搜索