MapReduce中爲什麼需要Input Splits?【翻譯】

爲什麼80%的碼農都做不了架構師?>>>    HDFS會把非常大的文件分割成多個大的數據塊(例如,128M),並且每一個數據塊在集羣的不同節點上存儲3個備份。HDFS並不知道也不關心這些文件的內容。 在yarn上,當一個Mapreduce任務開始時,Resource Manager(負責集羣的資源管理和任務調度)會創建一個Application Master守護進程來監視這個任務的生命週期。 (
相關文章
相關標籤/搜索