切片與MapTask並行度決定機制圖鑑

切片與MapTask並行度決定機制 數據塊:Block是HDFS物理上把數據分成一塊一塊。數據塊是HDFS存儲數據單位。 數據切片:數據切片只是在邏輯上對輸入進行分片,並不會在磁盤上將其切分成片進行存儲。數據切片是MapReduce程序計算輸入數據的單位,一個切片會對應啓動一個MapTask。
相關文章
相關標籤/搜索