序列模型與注意力機制總結

時間 2020-12-30

原文原文鏈接

1.翻譯即有條件的語言模型 2.1beam search 參數B 2.2 beam search 的概率表達式 2.3 在擴展一次 3.beam search 改進，修改評價函數爲 log，同時做normalization時，增加一個超參。 4.Beam width B 5. 誤差分析比較 beam search 跟 rnn 引起誤差的比例 6.Bleu score 7.1注意力

>>阅读原文<<