Spark2.0 特徵提取、轉換、選擇之一:數據規範化,String-Index、離散-連續特徵相互轉換

數據規範化(標準化) 在數據預處理時,這兩個術語能夠互換使用。(不考慮標準化在統計學中有特定的含義)。 下面全部的規範化操做都是針對一個特徵向量(dataFrame中的一個colum)來操做的。 首先舉一個例子:web //MaxAbsScaler例子(參考後面MaxAbsScaler部分) //例子:對特徵0,特徵1,特徵2,分別進行縮放,使得值爲[-1,1] //例如特徵0,其特徵向量爲[10
相關文章
相關標籤/搜索