Spark中RDD是什麼?

1、RDD是什麼? RDD是一個彈性可復原的分佈式數據集!分佈式 RDD是一個邏輯概念,一個RDD中有多個分區,一個分區在Executor節點上執行時,他就是一個迭代器。函數 一個RDD有多個分區,一個分區確定在一臺機器上,可是一臺機器能夠有多個分區,咱們要操做的是分佈在多臺機器上的數據,而RDD至關因而一個代理,對RDD進行操做其實就是對分區進行操做,就是對每一臺機器上的迭代器進行操做,由於迭代
相關文章
相關標籤/搜索