smooth l1

1.loss要規範化,這樣就不會受圖片大小的影響 2.w、h採用log:比較特殊的是w,hw,h的regression targets使用了log space. 師兄指點說這是爲了降低w,hw,h產生的loss的數量級, 讓它在loss裏佔的比重小些, 不至於因爲w,hw,h的loss太大而讓x,yx,y產生的loss無用 3.當預測值與目標值相差很大時, 梯度容易爆炸, 因爲梯度裏包含了x−t.
相關文章
相關標籤/搜索