Hadoop,Spark,Hive的一些知識複習

Hadoop包括兩個部分:分佈式存儲(HDFS)和分佈式計算mr Spark與Hadoop最大的區別是mapreduce的job的中間輸出結果能夠保存在內存中,不須要讀寫HDFS,是基於內存的迭代計算框架,適用於須要屢次操做特定數據集的應用場合。 mapreduce做業運行機制java 經典的mapreduce(mapreduce1)node 客戶端,提交mapreduce做業;jobtracke
相關文章
相關標籤/搜索