NORMFACE:L2 hypersphere embedding for face Verification

https://github.com/happynear/NormFace 本文的思想很簡單,就是通過驗證研究正則化的本質,來設計網絡結構。 提取問題: 1,爲什麼用classificatin  loss,尤其是softmax loss訓練cnn  特徵的時候,特徵正則化這麼有效果? 2,爲什麼用softmax loss  來直接優化餘弦相似度會導致 網絡不能收斂? 3,怎麼優化餘弦相似度? 3.
相關文章
相關標籤/搜索