NLP深度學習 —— CS224學習筆記10

2.3 深度雙向RNN 到目前我們都是使用以前的詞來預測後面的詞。 雙向深度神經網絡是在每個時間點t,同時有2個隱藏層,一個從左往右傳播,一個從右往左傳播。 最後的分類結果由兩個的結合產生。 方程式表達爲 多層的深度結構爲 2.4 應用:RNN翻譯模型 我們討論有RNN來替代傳統翻譯模型的可能性。 這裏前3個隱藏層時間點編碼來源語言,後2個將h3解碼到目標語言。 編碼階段 解碼階段 實踐中對交叉熵
相關文章
相關標籤/搜索