Spark常用算子

Spark的算子分爲兩種 1.transformation(轉換):這種算子是延遲加載,因爲消息緩存比較大 一旦使用了transformation算子,sc會記錄使用了那些算子,算子裏面使用了什麼函數 2.action:觸發計算 一旦觸發action算子,就會立即執行計算 RDD有兩種創建方式: 1.是從外界的文件系統中讀取數據來創建RDD 2.通過scala集合創建RDD,要將集合並行化(par
相關文章
相關標籤/搜索