Spark RDD

1.RDD 概述 1.1 什麼是 RDD ? RDD(Resilient Distributed Dataset) 叫着 彈性分佈式數據集 ,是Spark 中最基本的抽象,它代表一個不可變、可分區、裏面元素可以並行計算的集合。 RDD 具有數據流模型特點:自動容錯、位置感知性調度和可伸縮。 RDD 允許用戶在執行多個查詢時,顯示地將工作集緩存在內存中,後續的查詢能夠重用工作集,這將會極大的提升查詢
相關文章
相關標籤/搜索