知識卡片 迴歸性能度量 Log Loss




對數損失 Log Loss 又稱交叉熵損失 cross-entropy loss,二者名稱不一樣,實際上是等價的 ,經常使用於評價邏輯迴歸和神經網絡。
微信



什麼是邏輯迴歸 Logistics Regression?網絡


與線性迴歸估計出Y的是一個連續型的計量數值不一樣,邏輯迴歸實際上是一個分類方法。在二元邏輯迴歸中應變量Y是0和1,Y屬於分類數據,估計結果是一個機率,自變量是能夠包含多個對因變量有影響的因素,能夠是連續也但是分類數據;經過邏輯迴歸,得出每一個自變量的權重以及一個事件發生的機率。app



二類分類問題的Log Loss:測試


注:pr 是按照迴歸模型得出的機率spa


舉例說明:
.net



假設有四個測試樣本,y_true 列表是樣本的真實值,y_pred 列表中有四個元素,每一個樣本元素有兩個數值,分別表示不一樣類標籤(0和1)的預測機率,其和爲1。y_pred中的第同樣本的兩個元素[.9, .1] 表示樣本1有90%的機率屬於標籤y=0, 10%的機率屬於標籤y=1;依次計算每一個樣本的邏輯損失,以e爲底數算對數值,樣本求平均得出Log Loss。3d


多類分類的交叉熵(cross-entropy loss)損失blog


交叉熵公式中,N爲測試樣本總數,Yi,k 表示第 i 個樣本中的第 k 個標籤的真實值。 pi,k 表示預測值。事件


舉例說明:ci



好文章,我 在看❤

本文分享自微信公衆號 - DataScience(DataScienceTeam)。
若有侵權,請聯繫 support@oschina.cn 刪除。
本文參與「OSC源創計劃」,歡迎正在閱讀的你也加入,一塊兒分享。

相關文章
相關標籤/搜索