吳恩達《深度學習》第五課第三週

序列模型與注意力機制 3.1基礎模型 1.seq2seq模型 在法譯英句子中,輸入的法語有5個元素,輸出有6個元素。 首先我們需要構建一個編碼網絡,這是一個典型的RNN的結構(可以是GRU或LSTM) 每次只向網絡輸入一個法語單詞,在接收完序列後,RNN會輸出一個向量來代表輸入序列X<1>到X<5>。 然後構建解碼網絡,以編碼網絡的輸出作爲輸入,每次輸出一個翻譯後的單詞同時作爲下一個節點的輸入,一
相關文章
相關標籤/搜索