【機器學習】【seq2seq模型與attention機制，Beam Search】

時間 2020-12-30

原文原文鏈接

Beam Search一張圖來表示貪心的做法：每次選擇輸出概率最大的那個單詞，但是這樣無法保證最終整體概率最大；而集束搜索每次會選擇Beam個概率最大的單詞（Beam表示每次選擇單詞數，本例中爲3），然後進行下一步...直到最後會得到Beam個句子，挑出概率最大的那句就可以了。 seq2seq模型依賴於encode和decode兩個模塊。encoder用於對輸入序列編碼，decorder則是解碼

>>阅读原文<<