爲何分類問題使用交叉熵損失函數?

理由一: KL散度:衡量兩個機率分佈的差別 D ( P ∣ ∣ Q ) = H ( P , Q ) − H ( P ) D(P || Q) = H(P,Q)-H(P) D(P∣∣Q)=H(P,Q)−H(P) 其中, H ( P , Q ) = − ∑ i P ( i ) l o g Q ( i ) H(P,Q) =-\sum_iP(i)log Q(i) H(P,Q)=−∑i​P(i)logQ(i)
相關文章
相關標籤/搜索