Mapreduce基本工作流程

時間 2020-12-31

欄目 Hadoop 简体版

原文原文鏈接

map 端從hdfs讀入數據到完成映射到詳細過程：以用wordcount計算一個文本爲例讀取數據之後在內存中的大體形式是：鍵值對 map task 要做排序（方便索引），並且會把結果寫在本地磁盤上（而不是寫入hdfs，以免佔用大量資源），reduce直接通過yarn找到對應的map，從map的磁盤上讀取結果進行reduce（聚合）,也會通過歸併排序進行排序 reduce會把最終結果寫入hdf

>>阅读原文<<

相關文章

相關標籤/搜索

Activiti工做流

PHP 7 新特性

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。

最新文章

本站公眾號

歡迎關注本站公眾號,獲取更多信息

相關文章

>>更多相關文章<<