【模型性能2-泛化產生】Accurate, Large Minibatch SGD: Training ImageNet in 1 Hour

時間 2020-12-24

標籤機器學習简体版

原文原文鏈接

轉載https://blog.csdn.net/xxiaozr/article/details/80346381 Abstract: 這篇論文發現，在 ImageNet dataset 上使用 large minibatch 會導致優化困難，但是當這個問題解決了，模型具有更好的泛化能力，並且沒有精度上的損失爲達到這個目的，我們提出了 hyper-parameter-free linear sca

>>阅读原文<<