Hierarchical Attention Networks for Document Classification 模型理解篇

Hierarchical Attention Networks for Document Classification 模型理解篇 最近看了HAN用在文本分類的這篇文章。提出的模型使用了分層的注意力機制,對應了文本在字詞和句子兩個層面的結構。也就是分別在字詞層面和句子層面使用注意力機制。這樣做的好處有兩個:1.模型可以給與不同主要性的字詞或者句子不同的關注度,最終的任務效果因此會更好。2.注意力機
相關文章
相關標籤/搜索