【ML&DL】【skimming】The Loss Surfaces of Multilayer Networks

補了一下Yann LeCun的經典工作The Loss Surfaces of Multilayer Networks[1] 論文一覽: 痛點 文章假設並且陸續證明了這樣一些事情: 1)對於大網絡(large size network)而言,絕大多數局部極小值在test上的表現是差不多的,且這些local minima跟global minima的表現也是差不多的。 2)小網絡找到差的局部極小值(
相關文章
相關標籤/搜索