搜狗日誌查詢分析 (MapReduce+Hive綜合實驗)

下載搜狗實驗室查詢日誌,發現編碼是UTF-8。 將SogouQ文件夾下的文件從GBK編碼轉爲UTF-8編碼,結果存到SogouQ_UTF8中,其下的文件目錄不變: shell命令: find SogouQ -type d -exec mkdir -p SogouQ_UTF-8{} \; find SogouQ -type f -exec iconv -f GBK -t UTF-8 {} -o So
相關文章
相關標籤/搜索