Spark面試題

Spark面試題 RDD怎麼理解?html RDD 是 Spark 的靈魂,也稱爲彈性分佈式數據集。一個 RDD 表明一個能夠被分區的只讀數據集。RDD 內部能夠有許多分區(partitions),每一個分區又擁有大量的記錄(records)。Rdd的五個特徵: 1. dependencies: 創建 RDD 的依賴關係,主要 RDD 之間是寬窄依賴的關係,具備窄依賴關係的 RDD 能夠在同一個
相關文章
相關標籤/搜索