大數據系列(三)以日誌爲例,利用hadoop原生hdfs和MapReduce分別進行統計

目錄 使用java操做hdfs的api hdfs寫入數據的流程 利用hdfs來實現詞頻統計 使用MapReduce 使用MR來作wordcount 使用MR進行本地計算 使用MR來統計日誌 擴展之使用NullWritable來忽略key 擴展之設置分區來寫入不一樣文件 附上代碼倉庫 使用java操做hdfs的api 咱們來寫幾個demo,測試一下api:java package zl.hdfs;
相關文章
相關標籤/搜索