DL的小Trick

文章目錄 1 術語 1.1 泛化能力(generalization) 1.2 [:3]這個array的index表示取array的前三個 2 動量(慣性, 前一個梯度的慣性)(前一個梯度和當前梯度進行平行四邊形3333) 3 learning rate(剛開始設置大一些, 之後再搞的小一些) 1 術語 1.1 泛化能力(generalization) 從這個模型, 推廣到其他模型 如果這個網絡的參
相關文章
相關標籤/搜索