SPark 中RDD的介紹

目錄 背景描述 RDD介紹 1.基本概念 2.spark接口 3.RDDs接口5個特性 4.RDDs依賴關係 5.作業調度 6.內存管理 7.檢查點支持(checkpoint)  最後總結   背景描述        在hadoop中一個獨立的計算,例如在一個迭代過程中,除可複製的文件系統(HDFS)外沒有提供其他存儲的概念,這就導致在網絡上進行數據複製而增加了大量的消耗,而對於兩個的MapRed
相關文章
相關標籤/搜索