sigmoid 和 softmax,BCE與CE loss function

一句話概括 sigmoid 激活函數 二分類的激活函數 解決我是和不是的問題 對應二元交叉熵損失函數 softmax 激活函數 多分類的激活函數 解決我們中哪個是的問題 對應多元交叉熵損失函數 二分類推導 爲什麼用交叉商: 梯度下降的角度:從下面的推導過程可以看出來sigmoid對應的交叉商最後的梯度是一種殘差。mse 是高斯分佈的最大似然,二CE是多項式分佈的最大似然。https://zhuan
相關文章
相關標籤/搜索