jiebaR中文分詞，並作詞雲（R語言）

時間 2020-01-22

標籤 jiebar 中文分詞並作語言简体版

原文原文鏈接

使用結巴中文分詞（jiebaR）對以前爬取的新浪新聞文本進行分詞，統計詞頻以後，使用包wordcloud畫詞雲。python 一、讀入數據如下數據是在這裏爬取的，這裏只對社會新聞類進行測試，文件仍是比較大的。分詞完有一千多萬個詞，處理完後有將近30萬。web library(jiebaR) library(wordcloud) #讀入數據分隔符是‘\n’，字符編碼是‘UTF-8’，what=

>>阅读原文<<