【CS231n】Lecture 6:Training Neural Networks,Part 2

CS231n系列課程筆記:作爲本人的筆記記錄,並無商用用途 CS231n:http://cs231n.stanford.edu/ 參數更新(Parameter Update) 本文參數更新主要針對神經網絡中反向傳播過程中weights和biases的更新方式做的筆記。 SGD 缺點:水平方向平緩,垂直方向陡峭時,SGD容易發生抖動,找到最優解的時間最長 參數更新公式: Momentum 解釋:梯度
相關文章
相關標籤/搜索