歸一化,標準化和中心化

https://www.zhihu.com/question/20467170
參考了知乎的回答,以及wiki的解釋,我的的理解以下:
歸一化和標準化本質上都是對數據集特徵的縮放,而wiki的解釋中特徵的縮放通常有四種不一樣的公式spa

Rescaling (min-max normalization)

x'={\frac  {x-{\text{min}}(x)}{{\text{max}}(x)-{\text{min}}(x)}}

{\displaystyle x'=a+{\frac {(x-{\text{min}}(x))(b-a)}{{\text{max}}(x)-{\text{min}}(x)}}}

Mean normalization

{\displaystyle x'={\frac {x-{\text{average}}(x)}{{\text{max}}(x)-{\text{min}}(x)}}}

Standardization (Z-score Normalization)

x' = \frac{x - \bar{x}}{\sigma}

Scaling to unit length

{\displaystyle x'={\frac {x}{\left|{x}\right|_{2}}}}

歸一化的通常方法就是上面公式中的第一個公式,而標準化的方法經常使用公式就是Z-score的方法,這兩個方法都屬於線性轉換,都是按比例縮放,可是歸一化還有其餘方法,不必定是按比例縮放的,這樣就會致使數據的分佈不同。orm

<wiz_tmp_tag id="wiz-table-range-border" contenteditable="false" style="display: none;">get

 
 
 
 



相關文章
相關標籤/搜索