爲什麼「梯度下降法的神經網絡容易收斂到局部最優」是個錯覺--筆記

  一、 我們可能從來沒有找到過「局部最優」,更別說全局最優了。 作者:五樓whearer 鏈接:https://www.zhihu.com/question/68109802/answer/262143638 深度神經網絡「容易收斂到局部最優」,很可能是一種想象,實際情況是,我們可能從來沒有找到過「局部最優」,更別說全局最優了。 很多人都有一種看法,就是「局部最優是神經網絡優化的主要難點」。這來
相關文章
相關標籤/搜索