Hadoop綜合大作業

1.1.用Hive對爬蟲大作業產生的文本文件(或者英文詞頻統計下載的英文長篇小說)詞頻統計。 因爲大數據爬出來的數據不太適合進行詞頻統計,所以我換了一篇簡易的英文文章,其次因爲英文長篇小說實在是太長,詞頻統計出來截圖截不完。 2.用Hive對爬蟲大作業產生的csv文件進行數據分析,寫一篇博客描述你的分析過程和分析結果。 在做的過程中遇到個問題,因爲用python導出來的csv有亂碼,我是先嚐試用x
相關文章
相關標籤/搜索