深度學習之——word2vec

1. 文本表示:從one-hot到word2vec 文本表示的意思是把字詞處理成向量或矩陣,以便計算機能進行處理。文本表示是自然語言處理的開始環節。 文本表示按照細粒度劃分,一般可分爲字級別、詞語級別和句子級別的文本表示。 文本表示分爲離散表示和分佈式表示。離散表示的代表就是詞袋模型,one-hot(也叫獨熱編碼)、TF-IDF、n-gram都可以看作是詞袋模型。分佈式表示也叫做詞嵌入(word
相關文章
相關標籤/搜索