500萬條微博數據來源分析

最近項目不是特別忙,想作一些微博方面的分析和處理工做,若是本身現爬取微博數據,積累數據比較慢,剛好看到北理工張華平老師分享的500萬條微博數據,直接借用他的數據分析。下載地址是:http://www.nlpir.org/?action-viewnews-itemid-299數據庫 由於解壓以後的文件較大,足有2.1G,而且對格式不是很清楚,直接打開也沒法打開,因而先用文件分割工具將真格文件分割成多
相關文章
相關標籤/搜索