最簡版Seq2Seq的英法機器翻譯實踐和詳細代碼解釋

Seq2Seq的英法機器翻譯實踐

本文的內容主要是基於英法平行語料庫來實現一個簡單的英法翻譯模型。沒有使用注意力機制和雙向LSTM等技術,主要是爲了掌握基本的Seq2Seq結構和TensorFlow函數使用。使用TensorFlow 1.12.0,主要依靠 tf.contrib.seq2seq.BasicDecoder 函數。python

手擼可運行代碼 github.com/yuanxiaosc/…git

Seq2Seq 模型結構

使用方法

  1. python data_process.py
  2. python seq2seq_en_fr_translation_model.py
  3. python use_trained_model.py

使用模型作英法翻譯

【Input】
  Word Ids:      [120, 89, 131, 217, 171, 38, 180, 204, 208, 89, 103, 192, 213, 177]
  English Words: ['france', 'is', 'never', 'cold', 'during', 'september', ',', 'and', 'it', 'is', 'snowy', 'in', 'october', '.']

【Prediction】
  Word Ids:      [47, 235, 302, 325, 64, 204, 127, 81, 284, 117, 302, 72, 204, 63, 256, 1]
  French Words: ['la', 'france', 'est', 'jamais', 'froid', 'en', 'septembre', ',', 'et', 'il', 'est', 'neigeux', 'en', 'janvier', '.', '<EOS>']

【Full Sentence】
la france est jamais froid en septembre , et il est neigeux en janvier . <EOS>
複製代碼

代碼參考以及詳細的代碼解釋

Code reference github.com/NELSONZHAO/…github

基於TensorFlow框架的Seq2Seq英法機器翻譯模型bash

tensorflow Seq2seq編碼函數詳解框架

更多機器翻譯實戰 github.com/yuanxiaosc/…函數

相關文章
相關標籤/搜索