cs231閱讀筆記(2)—— 優化方法、正則化、遷移學習、軟硬件

文章目錄 優化方法 正則化(防止過擬合) transfer learning 遷移學習 硬件&軟件 優化方法 隨機梯度下降SGD 隨機梯度下降(SGD, stochastic gradient descent):名字中已經體現了核心思想,隨機選取一個店做梯度下降,而不是遍歷所有樣本後進行參數迭代。因爲梯度下降法的代價函數計算需要遍歷所有樣本,而且是每次迭代都要遍歷,直至達到局部最優解,在樣本量龐大
相關文章
相關標籤/搜索