超參數調試、Batch歸一化和程序框架

調試處理 不同的超參數,有不同的考慮優先等級,吳恩達的經驗如下。 第一優先級的超參數:學習率 α α 。 第二優先級的超參數:Momentum的 β β ,神經網絡每層的單元數(hidden units),mini-batch的子訓練集大小(mini-batch size)。 第三優先級的超參數:神經網絡的層數(layers),學習衰減率(learning rate decay) 第四優先集的超參
相關文章
相關標籤/搜索