SGD BGD MBGD各種梯度下降的處理方式

但在pytorch中,沒有分這種,所有方法都是一批全部計算,然後綜合所有數據的梯度反向傳播的,雖然名字叫做SGD,但也是一整批計算的,若要分批需採用torch.utils.Data下面的模塊來實現分批計算
相關文章
相關標籤/搜索