山書學習第四次筆記

機器翻譯及相關技術 數據預處理,一堆文本中,可能會出現不再ASCII可見字符的範圍中,有些數需其他的規範中,超出了gbk的範圍,所以應該去除。 原理 翻譯的過程就相當於,把初始文本翻譯成一個過度文本,然後再用一個解碼器,來輸出成想要的語言。 其中encoder爲: decoder: 注意力機制與Seq2seq模型 注意力機制 翻譯的過程中,有些時候直接一個字一個字的翻譯是不合邏輯的。就比如hell
相關文章
相關標籤/搜索