以 gensim 訓練中文詞向量

轉自: http://zake7749.github.io/2016/08/28/word2vec-with-gensim/ 最近正在嘗試幾種文本分類的算法,卻一直苦於沒有結構化的中文語料,原本是打算先爬下大把大把的部落格文章,再依 tag 將它們分門別類,可惜試了一陣子後,我見識到了理想和現實間的鴻溝。 儘管後來還是搞定了 所以就找上了基於非監督學習的 word2vec,為了銜接後續的資料處理,
相關文章
相關標籤/搜索