RNN,GRU和LSTM模型比較

文中圖片來源:吳恩達老師的深度學習視頻 視頻鏈接:https://www.bilibili.com/video/av49445369?p=152 對於標準的RNN來說,它是利用前一時刻的隱藏單元和該時刻的輸入一起學習,但是當小序列的相關信息相隔較長時,普通RNN常常不能學習的很好。舉個例子,(1)如果我們要預測「the clouds are in the sky」的最後一個單詞,因爲只在這一個句子
相關文章
相關標籤/搜索