機器學習算法中如何選取超參數:學習速率、正則項係數、minibatch size

機器學習算法中如何選取超參數:學習速率、正則項係數、minibatch size 本文是《Neural networks and deep learning》概覽 中第三章的一部分,講機器學習算法中,如何選取初始的超參數的值。(本文會不斷補充) 學習速率(learning rate,η) 運用梯度下降算法進行優化時,權重的更新規則中,在梯度項前會乘以一個係數,這個係數就叫學習速率η。下面討論在訓練
相關文章
相關標籤/搜索