spark自定義RDD

1、爲何須要自定義RDDjava        1. spark提供了不少方法讀數據源,好比咱們當前能夠從hdfs文件、jdbc、mongo、hbase等等將數據包裝成RDD供咱們後續進行處理。若是咱們想要讀memcache中的數據恐怕就沒有現成的了,須要咱們本身實現本身的RDD。sql        2. RDD是一種彈性分佈式數據集,本質就是對數據的封裝與抽象。講道理咱們能夠將任何咱們想要的數
相關文章
相關標籤/搜索