Spark 概念學習系列之Spark計算工作流(十二)

下圖 中描述了 Spark 的輸入、運行轉換、輸出。   在運行轉換中通過算子對 RDD進行轉換。   算子是 RDD 中定義的函數,可以對 RDD 中的數據進行轉換和操作。        輸入:在 Spark 程序運行中,數據從外部數據空間(例如, HDFS、 Scala 集合或數據)輸入到 Spark,數據就進入了 Spark 運行時數據空間,會轉化爲 Spark 中的數據塊,通過 Block
相關文章
相關標籤/搜索