word2vec 構建中文詞向量

word2vec 構建中文詞向量 詞向量作爲文本的基本結構——詞的模型,以其優越的性能,受到自然語言處理領域研究人員的青睞。良好的詞向量可以達到語義相近的詞在詞向量空間裏聚集在一起,這對後續的文本分類,文本聚類等等操作提供了便利,本文將詳細介紹如何使用word2vec構建中文詞向量。 一、中文語料庫 本文采用的是搜狗實驗室的搜狗新聞語料庫,數據鏈接 http://www.sogou.com/lab
相關文章
相關標籤/搜索