word2vec訓練中文詞向量

詞向量作爲文本的基本結構——詞的模型。良好的詞向量可以達到語義相近的詞在詞向量空間裏聚集在一起,這對後續的文本分類,文本聚類等等操作提供了便利,這裏簡單介紹詞向量的訓練,主要是記錄學習模型和詞向量的保存及一些函數用法。 一、搜狐新聞 1. 中文語料庫準備 本文采用的是搜狗實驗室的搜狗新聞語料庫,數據鏈接 http://www.sogou.com/labs/resource/cs.php 下載下來的
相關文章
相關標籤/搜索