Attention理解

基礎的Attention叫soft attentionblog a爲h的權重。io 那麼重點來了, 權重a是怎麼來的呢?常見有三種方法:class 思想就是根據當前解碼「狀態」判斷輸入序列的權重分佈。基礎
相關文章
相關標籤/搜索