神經網絡中的學習速率如何理解

特徵縮放 實際當我們在計算線性迴歸模型的時候,會發現特徵變量x,不同維度之間的取值範圍差異很大。這就造成了我們在使用梯度下降算法的時候,由於維度之間的差異使得Jθ的值收斂的很慢。 我們還是以房價預測爲例子,我們使用2個特徵。房子的尺寸(1~2000),房間的數量(1-5)。以這兩個參數爲橫縱座標,繪製代價函數的等高線圖能看出整個圖顯得很扁,假如紅色的軌跡即爲函數收斂的過程,會發現此時函數收斂的非常
相關文章
相關標籤/搜索