神經網絡概念基礎總結

1.使用softmax作爲最終層輸出。 計算每一個輸出的比例,最大概率的作爲最終預測的結果。 2、梯度下降 損失函數、、 J爲定義的損失函數 分別求權重矩陣w和偏置值b的梯度(偏導數),梯度下降可能進入局部最優解 3、fat+short VS. Thin+tall 扁平或者深層對比 一般來說深層 好於扁平的網絡 深層可以使用更多的特徵進行分類,每一層一個特徵 4、選擇適當的的損失函數 Square
相關文章
相關標籤/搜索