batch size 對神經網絡訓練的影響

先說結論:batch size並不是越大越好,也不是越小越好 batch size直觀上決定了一次餵給神經網絡的樣本數 引用怎麼選取訓練神經網絡時的Batch size?中的一張圖片說明batch size的影響: 如果使用 Gradient Descent,那麼每一步的更新都會向類似於黃線那種,同時滿足 6 個樣本的 去貼近 (不是一步到位,而是通過迭代一點點更新變形 如果使用 Stochast
相關文章
相關標籤/搜索