NLP初步學習算法

word2vec word2ve是詞聚類模型,是基於上下文的,關注的是詞與上下文的共現。 算法可以用word2vec+kmeans聚類。 LDA LDA是主題聚類模型,關注的是詞與文章的共現。LDA和doc2vec更與對比性。LDA很耗時,商業不喜歡用。 FastText 可以參考的博客地址 FastText是facebook開源的一個詞向量與文本分類工具,模型簡單且訓練速度快。 FastText
相關文章
相關標籤/搜索