02改善深層神經網絡-Optimization+methods-第二週編程作業1

【注意】「opt_utils.py」文件的第73行,最後部分「np.sqrt(2 / layer_dims[l-1]」要寫成「np.sqrt(2.0 / layer_dims[l-1]」!!! 因爲這個被坑了一晚上QAQ……   討論了不同的梯度下降方法:批處理下降和隨機梯度下降。 討論了三種不同的優化方法:Gradient descent、Momentum和Adam。 #coding=utf-8
相關文章
相關標籤/搜索