Hadoop綜合大作業

作業來源於:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/3363 本次作業是在期中大作業的基礎上利用hadoop和hive技術進行大數據分析 1.將爬蟲大作業產生的csv文件上傳到HDFS 2.對CSV文件進行預處理生成無標題文本文件         預處理:  使用awk腳本(com_pre_deal.sh)稍作處理,分隔開每一
相關文章
相關標籤/搜索