大數據知識點—spark概念,核心架構,運行流程

概念 Spark 提供了一個全面、統一的框架用於管理各種有着不同性質(文本數據、圖表數據等)的數據 集和數據源(批量數據或實時的流數據)的大數據處理的需求。 核心架構 Spark Core 包含 Spark 的基本功能;尤其是定義 RDD 的 API、操作以及這兩者上的動作。其他 Spark 的庫都 是構建在 RDD 和 Spark Core 之上的 Spark SQL 提供通過 Apache H
相關文章
相關標籤/搜索