序列模型和注意力機制基礎

時間 2021-01-13

原文原文鏈接

1. 序列結構的各種序列語言翻譯：在給出足夠多的法語和英語文本，訓練這個模型確實有效。。。圖像描述：這裏也確實證明了AleNet模型輸出的特徵向量確實包含了圖片的信息。總結： seq2seq模型主要來說就是由一個encoder+一個decoder構成。對於多個輸出序列如何選擇的問題，將在後面給出解決算法！ 2. 選擇最可能的句子對於語言模型來說，一般最開始的輸入是一個0向量，而機器翻

>>阅读原文<<