Distributed Representations of Sentences and Documents筆記

基本概念 段向量:一種將段落(段落長度可變,可以是句子和一篇文章等)表示成向量的無監督框架。 論文的提出是爲了解決什麼問題: 解決bag-of-words(詞袋模型)的缺點:不考慮詞的順序以及詞的語義。也就是說只要兩篇文章包含的詞一樣,詞袋模型就認爲這兩篇文章一樣。 句子表示中的平均化單詞權重導致的丟失句子順序的問題和合並詞向量的解析樹僅僅適用於句子的缺點。 段向量特點: 爲不同長度的段落訓練出同
相關文章
相關標籤/搜索