【重要】搜狗新聞語料庫,構建Word2Vec中文詞向量

具體請見: http://www.javashuo.com/article/p-rylmmcle-eq.html   一、中文語料庫 本文采用的是搜狗實驗室的搜狗新聞語料庫,數據鏈接 http://www.sogou.com/labs/resource/cs.php 下載下來的文件名爲: news_sohusite_xml.full.tar.gz 二、數據預處理 2.1 解壓並查看原始數據 cd
相關文章
相關標籤/搜索