Spark學習(1)——概述

Spark特點:     高效(比MapReduce快10~100倍)         內存計算引擎,提供Cache機制來支持需要反覆迭代計算或者多次數據共享,減少數據讀取的IO開銷         DAG引擎,減少多次計算之間中間結果寫到HDFS的開銷         使用多線程池模型來減少task啓動開銷,shuffle過程中避免不必要的sort操作以及減少磁盤IO操作     易用     
相關文章
相關標籤/搜索