數據預處理

標準化、歸一化 or 中心化? 注意:需要去除離羣值時,當數據本身比較聚集,也就是離散程度不高,使用3 σ \sigma σ會比箱型圖要好,因爲這個時候的箱型圖可能找不出離散值,都在1.5IQR以內。 爲什麼要線性變化 線性變換有很多良好的性質,這些性質決定了對數據改變後不會造成「失效」,反而能提高數據的表現,這些性質是歸一化/標準化的前提。比如有一個很重要的性質:線性變換不會改變原始數據的數值排
相關文章
相關標籤/搜索