學習率與動量的關係:此漲彼消,以達到動態平衡

選擇適當大小的學習率和動量,太大會使loss振盪,太小不足以使loss達到最優值。 1、train_gluon_ch7(‘sgd’, {‘learning_rate’: 0.004, ‘momentum’: 0.99}, features, labels) loss: 0.301315, 0.176527 sec per epoch 2、train_gluon_ch7(‘sgd’, {‘learn
相關文章
相關標籤/搜索