李宏毅機器學習筆記(4): Gradient descent

Gradient descent 1 回顧 在實際模型中,我們需要對參數進行處理,使用梯度下降法。 梯度下降過程 實際要求: θ=argmaxL(θ) L爲損失函數,θ爲參數 選取相應參數:θ1,θ2 隨機選取初始值:θ0=θ10θ20 梯度下降: 梯度: 算法過程: Gradient:loss的等高線的法線方向 2 調節你的學習率 學習率:梯度下降的步長,也是決定學習器的學習速度 如圖,如果學習
相關文章
相關標籤/搜索