深度學習:shuffle 的做用

shuffle 就是爲了不數據投入的順序對網絡訓練形成影響。web 增長隨機性,提升網絡的泛化性能,避免由於有規律的數據出現,致使權重更新時的梯度過於極端,避免最終模型過擬合或欠擬合。網絡 由於按照某些順序投入容易在訓練中走偏或陷入局部最優使得訓練效果出現差別,尤爲是當 batch size 比較小的時候。svg 關於 data.shuffle(buffer_size) 的學習post
相關文章
相關標籤/搜索