深度學習——記憶網絡

時間 2021-01-15

原文原文鏈接

大多數機器學習模型缺少可以讀取、寫入的長期記憶的內存結構，LSTM和RNN記憶太小了，不夠。下面是端到端單層網絡的具體流程：左邊輸入句子，通過Embedding轉換爲向量。下面輸入問題，轉換爲特徵，再通過softmax得到概率，輸出部分o加權求和，然後把輸入和O一起通過softmax得到最終的輸入。 key-Value記憶網絡

>>阅读原文<<