hive處理snappy壓縮文件

爲什麼80%的碼農都做不了架構師?>>>    這是WordCount的下集。 上週五往hdfs文件系統上傳了620G的文件,然後在上面跑了一個wc(MR)任務,運行3個半小時跑出了結果,結果是一個6.68M的snappy壓縮文件。如何分析這壓縮文件呢? 首先嚐試使用cat看一眼這個文件的內容,結果悲劇了,直接兩三分鐘沒有看完,全屏幕的亂碼,只有 ctrl + c 中斷。 然後查到 text命令可
相關文章
相關標籤/搜索