DeepLearning.ai code筆記5:序列模型

注意力機制模型 模型: 分爲 Encoder層,Attention層 和 Decoder層。 將 Encoder層 的每個時間片的激活值 s<t> s < t > 拷貝 Tx 次然後和全部激活值 a (Tx個時間片) 串聯作爲Attention 層的輸入,經過Attention層的計算輸出 ny n y 個阿爾法 α,使用不同激活值 a 作爲不同阿爾法 α 對每個單詞的注意力權重,相乘,即 α⋅a
相關文章
相關標籤/搜索