吳恩達DL lesson2 week3

3.1 調試處理(Tuning process) 關於訓練深度最難的事情之一是你要處理的參數的數量 1學習速率α 2Momentum(動量梯度下降法)的參數β 3如果使用Adam 優化算法的參數β1,β2,ε,但是通常使用默認值:0.9,0.999,10−8 4mini-batch 的大小 5不同層中隱藏單元的數量 6層數 7學習率衰減率 常用超參數搜索 https://www.cnblogs.c
相關文章
相關標籤/搜索