NLP修煉之旅(Day9)

文本表示:從one-hot到word2vec。 1.詞袋模型:離散、高維、稀疏。 1.分佈式表示:連續、低維、稠密。word2vec詞向量原理並實踐,用來表示文本 詞袋模型 文本表示分爲離散表示與分佈式表示,其中詞袋模型BoW(Bag-of-words)是n-gram語法模型的特例1元模型,該模型忽略掉文本的語法和語序等要素,將其僅僅看作是若干個詞彙的集合,文檔中每個單詞的出現都是獨立的。BoW使
相關文章
相關標籤/搜索