Spark總結

0. Spark 轉爲大規模數據處理設計的快速通用的計算引擎 基於內存,開源,並行計算 消除了mapreduce大量IO操做和僅支持批處理的缺陷 經過RDD彈性分佈式數據集,提供交互式查詢功能 基於scala面向函數語言編寫,便於操做RDD 可經過YARN管理分配資源,利用HDFS存儲數據 使用DAG有向無環圖執行引擎,內存/磁盤計算速度均比MR快 支持java,python,scala,R和sp
相關文章
相關標籤/搜索