Spark(三)————做業提交流程

一、Spark核心APIweb [SparkContext] 鏈接到spark集羣,入口點.緩存 [RDD] 它是一個分區的集合. 彈性分佈式數據集. 不可變的數據分區集合. 基本操做(map filter , persist) 分區列表 //數據 應用給每一個切片的計算函數 //行爲 到其餘RDD的依賴列表 //依賴關係 (可選)針對kv類型RDD的分區類 (可選)首選位置列表數據結構 [Had
相關文章
相關標籤/搜索