學習RNN中產生的幾個概念性疑問和解答

通常使用的損失函數——似然函數,爲什麼要加負對數取做負對數似然函數? (我以前一直說使用的是交叉熵,現在想想其實並不準確,從參數估計的角度來看,怎麼也是似然函數對吧?) 原因主要兩點: 如果假設條件是獨立同分布,那麼似然函數往往是連乘的形式,這樣子求偏導數,不容易;通過取對數的形式將連乘變爲求和。 概率值是小數,多個連乘的情況下,容易造成下溢 參考鏈接 負對數似然函數與交叉熵的關聯是什麼? 似然用
相關文章
相關標籤/搜索