120G+訓練好的word2vec模型（中文詞向量）

時間 2020-12-30

標籤 word2vec 中文詞向量 word2vec模型欄目 Microsoft Office 简体版

原文原文鏈接

從網上了解到，很多人缺少大語料訓練的word2vec模型，在此分享下使用120G+語料訓練好的word2vec模型。訓練語料：百度百科800w+條，20G+ 搜狐新聞400w+條，12G+（數據下載鏈接見其它博文）小說：90G左右模型參數： window=5 min_count=5 size=64 ps：其它參數見gensim庫，執行代碼爲：Word2Vec(sentence, windo

>>阅读原文<<