樣本數據的真實值爲什麼需要做中心化處理

假設下面的七個點是原始數據, 不做中心化需要用 一維的線性迴歸:y=kx+b 擬合得到紅線,紅線更容易被一些離羣點影響,而產生偏差,而綠線更穩定一些,因爲綠線是通過固定點的直線 中心化之後,假設改爲,y=kx ,只優化k就可以得到綠線。 當數據量很大時,這兩條線會趨於平行,也就等價了,但是在小數據量的時候還是做中心化的效果更好一點。 基於以上幾點對樣本數據做中心化效果會更好,那去中心化 到底該怎麼
相關文章
相關標籤/搜索