Spark學習筆記

Spark學習筆記 0.RDD:(彈性分佈式數據集(resilient/ rɪ'zɪlɪənt] / distributed dataset))。【並行計算】-不可變    RDD 是 Spark 對分佈式數據和計算的基本抽象。 1.Spark支持任何實現了Hadoop接口的存儲系統。Spark支持的Hadoop輸入格式包括文本文件、 SequenceFile、Avro、Parquet等。 2.S
相關文章
相關標籤/搜索