Hadoop綜合大作業

時間 2021-01-13

欄目 Hadoop 简体版

原文原文鏈接

1.1.用Hive對爬蟲大作業產生的文本文件（或者英文詞頻統計下載的英文長篇小說）詞頻統計。因爲大數據爬出來的數據不太適合進行詞頻統計，所以我換了一篇簡易的英文文章，其次因爲英文長篇小說實在是太長，詞頻統計出來截圖截不完。 2.用Hive對爬蟲大作業產生的csv文件進行數據分析，寫一篇博客描述你的分析過程和分析結果。在做的過程中遇到個問題，因爲用python導出來的csv有亂碼，我是先嚐試用x

>>阅读原文<<

相關文章

相關標籤/搜索

Docker命令大全

Hibernate教程

PHP 7 新特性

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。

最新文章

本站公眾號

歡迎關注本站公眾號,獲取更多信息

相關文章

>>更多相關文章<<