分佈式計算框架

                                      分佈式計算框架 Hadoop是基礎,其中的HDFS提供文件存儲,Yarn進行資源管理。在這上面可以運行MapReduce、Spark、Tez等計算框架。 MapReduce:是一種離線計算框架,將一個算法抽象成Map和Reduce兩個階段進行處理,非常適合數據密集型計算。 Spark:Spark是UC Berkeley A
相關文章
相關標籤/搜索