《動手學深度學習Pytorch版》Task4-機器翻譯及相關技術;注意力機制與Seq2seq模型;Transformer

機器翻譯及相關技術 Task2中的循環神經網絡部分,有實現預測歌詞的功能。在那個任務中,訓練數據的輸入輸出長度是固定的,而在機器翻譯中,輸出的長度是不固定的,所以不能直接用RNN來處理這種任務。 Encoder-Decoder框架是常用於機器翻譯,對話系統這類場景的框架。 需要注意的是,在訓練過程中Decoder的輸入是真實的label,而預測時,輸入是上一個ceil的預測值 機器翻譯解碼 通常用
相關文章
相關標籤/搜索