我理解的RNN、LSTM的工作

最近看RNN和LSTM 的工作原理看了很多,也慢慢有了些體會。 先從輸入輸出介紹(大部分來自知乎) 例如這樣一個數據集合,總共100條句子,每個句子20個詞,每個詞都由一個80維的向量表示。在lstm中,單個樣本即單條句子輸入下(shape是 [1 , 20, 80]),假如設定每一個time step的輸入是一個詞(當然這不一定,你也可以調成兩個詞或者更多個數的詞),則在t0時刻是第一個時間步,
相關文章
相關標籤/搜索