hadoop之mapReduce

概述 mapReduce是hadoop中的分佈式計算框架 TaskTracker就是NodeManager JobTacker就是ResourceManager . . 序列化 要求數據能被序列化,默認採用avro,mapreduce對avro做了封裝,有writable接口 . . 分區 不設置默認一個分區,編號從0開始 分區數決定reduce的數量 . . 排序 繼承Comparable接口或
相關文章
相關標籤/搜索