GRU網絡

GRU網絡 簡介 隨着 LSTM 在自然語言處理特別是文本分類任務的廣泛應 用,人們逐漸發現 LSTM 具有訓練時間長、參數較多、內部計 算複雜的缺點。Cho 等人在 2014 年進一步提出了更加簡單的、 將 LSTM 的單元狀態和隱層狀態進行合併的、還有一些其他的 變動的 GRU 模型。將忘記門和輸入門合成了一個單一的更新門。同樣還混合了細胞狀態和隱藏狀態。GRU把LSTM中的遺忘門和輸入們用更
相關文章
相關標籤/搜索