RDD詳解

Job 邏輯執行圖 General logical plan 典型的 Job 邏輯執行圖如上所示,經過下面四個步驟可以得到最終執行結果: 從數據源(可以是本地 file,內存數據結構, HDFS,HBase 等)讀取數據創建最初的 RDD。上一章例子中的 parallelize() 相當於 createRDD()。 對 RDD 進行一系列的 transformation() 操作,每一個 tran
相關文章
相關標籤/搜索