做業來源:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/33633d
1.將爬蟲大做業產生的csv文件blog
2.對CSV文件進行預處理生成無標題文本文件get
3.把上傳到hdfs中的文本文件最終導入到數據倉庫Hive中csv
4.在Hive中查看並分析數據im
查詢表中數據條數:d3
查詢id不重複的條數:數據