爲何要獨熱編碼、優缺點、

1、爲何要獨熱編碼? 獨熱編碼(啞變量 dummy variable)是由於大部分算法是基於向量空間中的度量來進行計算的,爲了使非偏序關係的變量取值不具備偏序性,而且到圓點是等距的。使用one-hot編碼,將離散特徵的取值擴展到了歐式空間,離散特徵的某個取值就對應歐式空間的某個點。將離散型特徵使用one-hot編碼,會讓特徵之間的距離計算更加合理。離散特徵進行one-hot編碼後,編碼後的特徵,其
相關文章
相關標籤/搜索