吳恩達深度學習:第二課,第二週:優化算法

文章目錄 Mini-batch 梯度下降法 符號定義 前向傳播 後向傳播 理解mini-batch 梯度下降法 J代價函數的不同 用1個樣本爲一個mini-batch和全部樣本爲一個mini-batch舉例 合理的簇大小 指數加權平均 理解指數加權平均 指數加權平均的偏差修正 動量梯度下降法 優化成本函數 RMSprop算法 Adam 優化算法 算法公式: 該算法的超參數 學習率衰減 局部最優的問
相關文章
相關標籤/搜索