pytorch學習筆記(三十一):門控循環單元(GRU)

文章目錄 前言 1. 門控循環單元 1.1 重置門和更新門 1.2 候選隱藏狀態 1.3 隱藏狀態 2. 讀取數據集 3. 從零開始實現 3.1 初始化模型參數 3.2 定義模型 3.3 訓練模型並創做歌詞 4. 簡潔實現 小結 前言 當時間步數較大或者時間步較小時,循環神經網絡的梯度較容易出現衰減或爆炸。雖然裁剪梯度能夠應對梯度爆炸,但沒法解決梯度衰減的問題。一般因爲這個緣由,循環神經網絡在實際
相關文章
相關標籤/搜索