機器學習之CTR預估評價指標

一 離線、在線評價指標 1.1 LogLoss對數損失 熵 熵的主要作用是告訴我們 最優編碼信息方案的理論下界(存儲空間),以及度量數據的信息量的一種方式。理解了熵,我們就知道有多少信息蘊含在數據之中,現在我們就可以計算當我們 用一個帶參數的概率分佈來近似替代原始數據分佈的時候,到底損失了多少信息。 交叉熵 KL散度(相對熵) 上式中 代表觀察樣本的真實分佈概率, 代表對觀察樣本的一種近似分佈。
相關文章
相關標籤/搜索