歸一化在梯度下降中的作用

    在梯度下降中多數時候原始數據若沒經過特徵處理,數據的各個維度是存在着量級的差別,假如線性函數Ax+By+b=C,X維度數量級是十,Y的數量級是萬,那麼求出的A就比B大,那麼在用梯度下降求解最優解過程中,對A求偏導每次變化是和X成線性的(結果只和x相關),對B求偏導是和B成線性的(結果只與y相關),這樣就造成兩個維度下降速度不一致的問題,在圖像上面顯示就是A每次走的step很小,B的step
相關文章
相關標籤/搜索