深度學習——記憶網絡

大多數機器學習模型缺少可以讀取、寫入的長期記憶的內存結構,LSTM和RNN記憶太小了,不夠。 下面是端到端單層網絡的具體流程: 左邊輸入句子,通過Embedding轉換爲向量。下面輸入問題,轉換爲特徵,再通過softmax得到概率,輸出部分o加權求和,然後把輸入和O一起通過softmax得到最終的輸入。 key-Value記憶網絡
相關文章
相關標籤/搜索