beam search

假設詞表大小爲3,內容爲a,b,c。beam size是2 decoder解碼的時候: 1: 生成第1個詞的時候,選擇概率最大的2個詞,假設爲a,c,概率分別爲log(p(1_a)) log(p(1_c)) 那麼當前序列就是a,c,對應的概率是 log(p1_0)=log(p(1_a)) log(p1_1)= log(p(1_c)) 2:生成第2個詞的時候,假如當前對三個詞的概率預測爲
相關文章
相關標籤/搜索