【機器學習】【seq2seq模型與attention機制,Beam Search】

Beam Search一張圖來表示 貪心的做法:每次選擇輸出概率最大的那個單詞,但是這樣無法保證最終整體概率最大;而集束搜索每次會選擇Beam個概率最大的單詞(Beam表示每次選擇單詞數,本例中爲3),然後進行下一步...直到最後會得到Beam個句子,挑出概率最大的那句就可以了。 seq2seq模型依賴於encode和decode兩個模塊。encoder用於對輸入序列編碼,decorder則是解碼
相關文章
相關標籤/搜索