關於神經網絡理論的幾個疑問與思考

1,loss function應該如何設計?如果我需要修改loss function,需要遵循哪些規則? 我看到caffe中有多種不同的loss層,但是不理解爲什麼要這樣設計。我有時候很想改loss function,但是又不知道這樣改理論上是否可行。 說兩個具體的問題: 第一,比如,DRML(2016,CVPR)中用multi label sigmoid 交叉熵函數作爲loss function
相關文章
相關標籤/搜索