《deep learning》學習筆記(8)——深度模型中的優化

https://blog.csdn.net/u011239443/article/details/80046684 機器學習中的算法涉及諸多的優化問題,典型的就是利用梯度下降法(gradient descent)求使損失函數 J(theta) 下降的模型參數 theta 。在深度學習,尤其是深度神經網絡的訓練和預測中,大的模型往往要花上數天甚至是數月的訓練時間,因此雖然模型的優化費事費力,仍然是一
相關文章
相關標籤/搜索