LSTM變種-GRU網絡結構

簡介 GRU是LSTM的一種變體,其將忘記門和輸入門合成了一個單一的更新門。同樣還混合了細胞狀態和隱藏狀態,加諸其他一些改動。最終的模型比標準的 LSTM 模型要簡單,是非常流行的變體。 使用LSTM的原因之一是解決RNN Deep Network的Gradient錯誤累積太多,以至於Gradient歸零或者成爲無窮大,所以無法繼續進行優化的問題。GRU的構造更簡單:比LSTM少一個gate,這樣
相關文章
相關標籤/搜索