Spark RDD詳解

http://www.cnblogs.com/cenyuhai/p/3779125.html   最近在閱讀源碼,發現這篇博客內容非常好,有助於快速理解代碼。       1、什麼是RDD?   上一章講了Spark提交作業的過程,這一章我們要講RDD。簡單的講,RDD就是Spark的input,知道input是啥吧,就是輸入的數據。 RDD的全名是Resilient Distributed Da
相關文章
相關標籤/搜索