分類問題爲何選擇交叉熵二不使用均方差

通俗的說:通常咱們使用平方差做爲損失函數,(y^'-y)^2做爲損失函數,這種損失函數在進行梯度降低計算的時候會出現梯度彌散,致使學習速率降低,使用交叉熵做爲損失函數能夠很好的解決這個問題。網絡 解釋:均方差正態分佈函數   在訓練神經網絡中,使用分類錯誤率或是均方差每每會丟掉不少有用的信息學習 舉例證實spa
相關文章
相關標籤/搜索