神經網絡權重矩陣初始化的意義?

  例如LSTM第一個單元權重矩陣正交化,預訓教詞向量,還有各種權重矩陣初始化的技巧。 想問的就是反正最後都得擬合了,初始化的意義何在?爲了更快收斂還是對效…顯示全部 ​   也說說我的看法,神經網絡要優化一個非常複雜的非線性模型,而且基本沒有全局最優解,初始化在其中扮演着非常重要的作用,尤其在沒有BN等技術的早期,它直接影響模型能否收斂。下面從幾個方向來說,參考 龍鵬:【AI初識境】什麼是深度學
相關文章
相關標籤/搜索