Spark RDD詳解

    RDD(Resilient Distributed Datasets)彈性的分佈式數據集,又稱Spark core,它代表一個只讀的、不可變、可分區,裏面的元素可分佈式並行計算的數據集。     RDD是一個很抽象的概念,不易於理解,但是要想學好Spark,必須要掌握RDD,熟悉它的編程模型,這是學習Spark其他組件的基礎。筆者在這裏從名字和幾個重要的概念給大家一一解讀: Resilie
相關文章
相關標籤/搜索