Hadoop,Spark,Hive的一些知識複習

Hadoop包括兩個部分:分佈式存儲(HDFS)和分佈式計算mr Spark與Hadoop最大的區別是mapreduce的job的中間輸出結果可以保存在內存中,不需要讀寫HDFS,是基於內存的迭代計算框架,適用於需要多次操作特定數據集的應用場合。 mapreduce作業運行機制 經典的mapreduce(mapreduce1) 客戶端,提交mapreduce作業;jobtracker,協調作業的運
相關文章
相關標籤/搜索