Seq2seq模型、機器翻譯學習筆記

Seq2seq模型 當輸入和輸出都是不定長序列時,可以使⽤編碼器—解碼器(encoder-decoder) 或者seq2seq模型。這兩個模型本質上都⽤到了兩個循環神經⽹絡,分別叫做編碼器和解碼器。編碼器⽤來分析輸⼊序列,解碼器⽤來⽣成輸出序列。 圖中描述了使⽤編碼器—解碼器將英語句⼦翻譯成法語句⼦的⼀種⽅法。在訓練數據集中,可以在每個句⼦後附上特殊符號「」(end of sequence)以表⽰
相關文章
相關標籤/搜索