Seq2seq+attention機制理解

部分一:背景 部分二:基本介紹 這裏我們將encoder階段叫做編碼階段。對應的decoder階段叫做解碼階段。中間語義向量C可以看做是所有的輸入內容的一個集合,所有的輸入內容都包括在隱藏狀態C裏面。 說明:此時每一個輸入序列末尾添加;若序列長度較短,可在後面附上符號,如下: 部分三 編碼階段(假設一共有T時刻) 解碼階段 對於整體預測概率爲 中間向量C 部分四 添加: 注意力機制(一圖勝千言)
相關文章
相關標籤/搜索