Spark快速大數據分析之第三章RDD編程

RDD基礎 RDD包含兩種操做:python 轉化操做:由一個 RDD 生成一個新的 RDD,採起惰性求值策略:不會立刻進行運算,直到下一個行動操做纔會運算安全 行動操做:對 RDD 計算出一個結果,並把結果返回到驅動器程序中,或把結果存儲到外部存儲系統(如 HDFS)中函數 惰性求值code 雖然你能夠在任什麼時候候定義新的 RDD,但 Spark 只會惰性計算這些 RDD。它們只有第一次在一個
相關文章
相關標籤/搜索