CS224n 深度自然語言處理(四) Note - Backpropagation and computation graphs

本文爲筆者學習CS224N所做筆記,所包含內容不限於課程課件和講義,還包括筆者對機器學習、神經網絡的一些理解。所寫內容難免有難以理解的地方,甚至可能有錯誤。如您在閱讀中有疑惑或者建議,還望留言指正。筆者不勝感激! 在本章中,將着重討論以下內容: 如何更新神經網絡參數? 以何種形式保存更新結構? 搭建和訓練神經網絡的技巧. 梯度和導數 上一章提到,應該最小化損失函數。損失函數的參數是神經網絡參數,由
相關文章
相關標籤/搜索