你真的懂one-hot編碼嗎?

一個很隱晦的問題         在迴歸,分類,聚類等機器學習算法中,特徵之間距離的計算或相似度的計算是非常重要的,而我們常用的距離或相似度的計算都是在歐式空間的相似度計算,計算餘弦相似性,基於的就是歐式空間,所以往往默認數據數據是連續的(可以計算距離?),並且是有序的。但是有時用數字表示的數據並不是有序的,而是隨機分配的。 舉個例子:有一個離散型特徵,代表工作類型,該離散型特徵,共有三個取值,不
相關文章
相關標籤/搜索