focal loss分析圖 (完善知乎的一個評論)

Focal loss 全圖 Focal loss 局部放大圖 首先我覺得(個人猜測)一個樣本的作用大小, 不是直接由它對應的loss決定的, 而是由這個樣本對應loss對權值w的梯度決定的. 因爲梯度越大, 則權值更新得越多(是朝着該樣本loss減小的方向更新越多) 用one-hot做交叉熵loss的話, 樣本 x i x^i xi(假設屬於類別k)對應的loss: l o s s x k i =
相關文章
相關標籤/搜索