分析4萬條房天下業主論壇數據1---「朝陽新城」小區的全方位測評

本來是學爬蟲的,然後,靈感一現,爬爬業主論壇看看北京小區咋樣,然後爬了30多萬業主論壇的數據,爬了就要分析一下啦,又花了一整個寒假學習分析這些數據,一遍自學NLP一遍實踐^_^,利用情感分析+分類器(這塊不是我做的,另一個隊友),最終得到了以下結果。分析的不夠全面,沒有結合mapreduce、機器學習等技術,所以數據量(分配到朝陽新城)大概就幾百條,所以結果僅供娛樂~ 使用:爬蟲是用Python3
相關文章
相關標籤/搜索