SparkCore

1、RDD:Resilient Distributed DateSet,彈性分佈式數據集 五大特性web 是由一系列partition組成 函數做用在每一個partition上 partition之間有一系列依賴關係 分區器做用在K,V格式的RDD上 RDD提供一些列最佳的計算位置 1.默認狀況下,一個block對應一個partition 2.RDD並不存儲數據,個人理解是:app RDD就是一些
相關文章
相關標籤/搜索