hadoop之mapreduce

mapreduce 核心思想:讓我們的運算程序並行在多臺機器上執行! mapreduce運行平臺YARN mapreduce程序應該是在很多機器上並行啓動,而且先執行map task,當衆多的maptask都處理完自己的數據後,還需要啓動衆多的reduce task,這個過程如果用用戶自己手動調度不太現實,需要一個自動化的調度平臺——hadoop中就爲運行mapreduce之類的分佈式運算程序開發
相關文章
相關標籤/搜索