Seq2Seq模型

seq2seq模型即通過序列預測序列,但是相對於傳統單一深度學習系統,如CNN或者RNN,這些模型的輸入輸出都是固定的長度,比如圖像識別中圖像的大小。但是對於機器翻譯或者語音對話而言,由於輸入的序列文本大小可變,預測輸出也是可變的,因而這種單一的格式很難適應。因此提出了seq2seq模型,這是一種編解碼架構模型(encoder-decoder) 大體原理個人解釋: 對於輸入序列,假設序列長度統一爲
相關文章
相關標籤/搜索