序列模型和注意力機制基礎

1. 序列結構的各種序列 語言翻譯: 在給出足夠多的法語和英語文本,訓練這個模型確實有效。。。 圖像描述: 這裏也確實證明了AleNet模型輸出的特徵向量確實包含了圖片的信息。 總結: seq2seq模型主要來說就是由一個encoder+一個decoder構成。 對於多個輸出序列如何選擇的問題,將在後面給出解決算法! 2. 選擇最可能的句子 對於語言模型來說,一般最開始的輸入是一個0向量,而機器翻
相關文章
相關標籤/搜索