RDD深刻講解

RDD原碼:https://github.com/apache/spark/tree/master/core/src/main/scala/org/apache/spark/rddgit 什麼是RDD? 一個彈性可分佈式的數據集。彈性主要體如今計算之上。他是spark裏一個最基本的抽象單元。表明了一個immutable(不可變的),可以並行操做的能夠被分區的數據集 partitioned coll
相關文章
相關標籤/搜索