序列模型與注意力機制總結

1.翻譯即有條件的語言模型 2.1beam search  參數B 2.2  beam search 的 概率表達式 2.3 在擴展一次   3.beam search 改進, 修改評價函數爲 log,同時做normalization時,增加一個超參。 4.Beam width B 5. 誤差分析 比較 beam search 跟 rnn 引起誤差的比例 6.Bleu score   7.1注意力
相關文章
相關標籤/搜索