attention

原理介紹 相關論文 Hierarchical Attention Networks for Document Classification Word Encoder: ①給定一個句子si,例如 The superstar is walking in the street,由下面表示[wi1,wi2,wi3,wi4,wi5,wi6,wi1,wi7],我們使用一個詞嵌入矩陣W將單詞編碼爲向量 使用雙向
相關文章
相關標籤/搜索