Hadoop基礎知識:關於MapReduce

一、定義:是一種用於數據處理的編程模型,本質上是並行運行的,優點在於大規模處理數據集編程 MapReduce分爲map函數和reduce函數函數         一、map該函數輸入的是原始數據(文本格式便可),鍵值是某一行的起始位置對於文件的起始位置的偏移量,map只是一個數據的準備階段,經過這種方式準備數據,是的reduce可以繼續對數據處理map         二、對map函數的數據處理,
相關文章
相關標籤/搜索