樣本數據的真實值爲何須要作中心化處理

假設下面的七個點是原始數據,優化 不作中心化須要用 一維的線性迴歸:y=kx+b 擬合獲得紅線,紅線更容易被一些離羣點影響,而產生誤差,而綠線更穩定一些,由於綠線是經過固定點的直線 中心化以後,假設改成,y=kx ,只優化k就能夠獲得綠線。 當數據量很大時,這兩條線會趨於平行,也就等價了,可是在小數據量的時候仍是作中心化的效果更好一點。 基於以上幾點對樣本數據作中心化效果會更好,那去中心化 到底該
相關文章
相關標籤/搜索