莫凡機器學習課程筆記

怎樣區分好用的特徵 避免無意義的信息 避免重複性的信息 避免複雜的信息 **函數的選擇 淺層神經網絡,可以隨便嘗試各種**函數 深層神經網絡,不可隨機選擇各種**函數,這涉及到梯度爆炸和梯度消失。(給出梯度爆炸和梯度消失的度量來判別**函數的效果) 卷積神經網絡,推薦的**函數是 relu 循環神經網絡,推薦的**函數是relu or tanh 加速神經網絡訓練 Stochastic Gradie
相關文章
相關標籤/搜索