動手學深度學習第十八課:seq2seq(編碼器和解碼器)和注意力機制

rnn->seq2seq:rnn的輸出是定長的,而seq2seq的輸出是不定長的了: 編碼器和解碼器: 編碼器和解碼器是2個RNN。 背景變量C encoder先把輸入信息存入c,decoder再給弄出來。 參數怎麼確定呢? 引入雙向: 雙向拼接的時候不是加,而是:連接兩個向量。 。 輸入的h0可以全部爲零,但是輸出的h‘0一般不隨機,給一個第一個詞的信息。 上述模型有一點是,輸出解碼時每一時刻的
相關文章
相關標籤/搜索