tensorflow簡單使用案例--mnist數集分類(2)-二次代價函數

1.二次代價函數 輸出a之前要經過激活函數?爲什麼? 二次代價函數: 2.梯度下降法 假如我們使用梯度下降法(Gradient descent)來調整權值參數的大小,w和b的梯度跟激活函數的梯度成正比,激活函數的 梯度越大,w和b的大小調整得越快,訓練收斂得就越快。 3.交叉熵代價函數(不改變激活函數) 二次代價函數權值修正效果不好。 改變代價函數,改用交叉熵代價函數: 不作推到了……………… 4
相關文章
相關標籤/搜索