spark2學習(2) 之RDD編程

  RDD編程指南 實際上從spark2開始就不推薦使用rdd了,使用dataset操做更加簡單高效,可是咱們仍是簡單介紹一下內容吧html 彈性分佈式數據集(RDD) Spark圍繞彈性分佈式數據集(RDD)的概念展開,RDD是能夠並行操做的容錯的容錯集合。建立RDD有兩種方法:並行化 驅動程序中的現有集合,或引用外部存儲系統中的數據集,例如共享文件系統,HDFS,HBase或提供Hadoop
相關文章
相關標籤/搜索