LSTM變種-GRU網絡結構

簡介 GRU是LSTM的一種變體,其將忘記門和輸入門合成了一個單一的更新門。一樣還混合了細胞狀態和隱藏狀態,加諸其餘一些改動。最終的模型比標準的 LSTM 模型要簡單,是很是流行的變體。 使用LSTM的緣由之一是解決RNN Deep Network的Gradient錯誤累積太多,以致於Gradient歸零或者成爲無窮大,因此沒法繼續進行優化的問題。GRU的構造更簡單:比LSTM少一個gate,這樣
相關文章
相關標籤/搜索