大數據開發面試部分:運行一個 hadoop 任務的流程是什麼樣的(大數據開發面試)

1、 導入數據對需分析的數據進行分片,片的大小默認與 datanode 塊大小相同。 2、 每個數據片由一個 mapper 進行分析,mapper 按照需求將數據拆分爲一個個 keyvalue 格式的數據。 3、 每個 key-value 數據調用一次 map 方法,對數據進行相應的處理後輸出。 4、 將輸出的數據複製到對應的分區,默認一個鍵一個區,相同鍵放在同一個區中。 5、 將輸出的數據進行合
相關文章
相關標籤/搜索