深度學習筆記(二)(2)優化算法

深度學習筆記(二)(2)優化算法 2.1 Mini-batch 梯度下降(Mini-batch gradient descent) 2.2 理解 mini-batch 梯度下降法(Understanding mini-batch gradient descent) 你需要決定的變量之一是 mini-batch 的大小,𝑚就是訓練集的大小,極端情況下: 如果 mini-batch 的大小等於𝑚,
相關文章
相關標籤/搜索