注意力機制的解讀

先看原始的機器翻譯的模型 左邊的是編碼器,右邊的是解碼器。什麼意思呢?就是左邊部分輸入中文,然後編碼器前向傳播傳遞到盡頭後,傳入解碼器,解碼器通過編碼器傳入的值,先輸出第一個翻譯出來的英文單詞,然後把輸出的第一個英文單詞輸入第二塊,輸出第二個英文單詞,以此類推。便可以實現機器翻譯。 但是這樣做,會出現一個問題,就是對長句子的翻譯能力不好。就像沒有複習長難句的人去看英語閱讀,看不懂。這時,便引入了注
相關文章
相關標籤/搜索