學以致用——微博文章內容統計分析之一(Excel+GraphLab)

記得以前一位同事說過,好的技術人員都是比較懶的,因爲懶,他會想盡辦法找到解決問題的最有效的方法。 如果不使用Excel函數,完全可以通過人肉的方式從微博中提取內容,但是,如果數據量很大、需要耗用很多時間怎麼辦? 爲了分析在微博中總共分析了多少條使用「形色」軟件識別出的花花草草,採用了以下步驟。 1. 使用微博的搜索功能,搜索出所有包含「形色」關鍵字的微博文章,得到「搜索結果」頁。 2. 想通過Ex
相關文章
相關標籤/搜索