《機器學習》(周志華)筆記之降維(一)

西瓜書第十章降維,以kNN開篇,旨在尋找樣本點的「近鄰」,但當維度過高且樣本稀疏時,一種自然地解決思路就是「降維」。人們觀測到的數據樣本雖是高維的,但與學習任務緊密相關的也許僅是一個低維分佈,即高維空間中的一個低維嵌入。 kNN:     1、不同的k      2、不同的距離計算方式       會導致分類結果有顯著地不同 但其泛化錯誤率不超過貝葉斯最優分類器的錯誤率的兩倍。簡單的模型也許會有更
相關文章
相關標籤/搜索