【Spark】Spark核心之彈性分佈式數據集RDD

1. RDD概述  1.1 什麼是RDD     (1) RDD(Resilient Distributed Dataset)彈性分佈式數據集,它是Spark的基本數據抽象,它表明一個不可變、可分區、裏面的元素可並行計算的集合。編程     (2) 具備數據流模型的特色:自動容錯、位置感知性調度、可伸縮性。 數組     (3) 查詢速度快:在執行多個查詢時,能夠顯示的將工做集緩存到內存中,後續的
相關文章
相關標籤/搜索