關於lstm的理解

lstm是rnn的提高,解決了梯度消失的問題。時間 rnn中h 是上一步的輸出(提取出了上一步的特徵),和下一步的輸入一塊兒組合成新的輸入, rnn中反向傳播時,最後一步結果對於中間某一步h的導師遵循鏈式鏈式連乘法則,若是h前面的係數矩陣過小,就慢慢梯度消失 lstm中把h的狀態選擇addtattive的方式進行更新,上一步的h減一部分,這一部分的x中更新上去一部分。cell代替了以前rnn中h,
相關文章
相關標籤/搜索