《deep learning》學習筆記（8）——深度模型中的優化

時間 2020-12-24

原文原文鏈接

https://blog.csdn.net/u011239443/article/details/80046684 機器學習中的算法涉及諸多的優化問題，典型的就是利用梯度下降法(gradient descent)求使損失函數 J(theta) 下降的模型參數 theta 。在深度學習，尤其是深度神經網絡的訓練和預測中，大的模型往往要花上數天甚至是數月的訓練時間，因此雖然模型的優化費事費力，仍然是一

>>阅读原文<<