Hadoop for .NET Developers(十四):瞭解MapReduce和Hadoop流

在Hadoop中,通過MapReduce作業解決數據處理。作業由基本配置信息組成,例如輸入文件和輸出文件夾的路徑,由Hadoop的MapReduce層執行一系列任務。這些任務負責首先執行map和reduce功能,以便將輸入數據轉換爲輸出結果。 爲了說明MapReduce如何工作,請考慮一個簡單的輸入文件,其中包含製表符分隔的記錄(在下圖的最左側)。爲了說明的目的,每一行將被標記爲A到F。 MapR
相關文章
相關標籤/搜索