Spark RDD編程指南(官網翻譯)

概觀 與Spark連接 初始化Spark 使用Shell 彈性分佈式數據集(RDD) 並行化集合 外部數據集 RDD操做 基本 將函數傳遞給Spark 瞭解關閉 例 本地或羣集模式 打印RDD的元素 使用鍵值對 轉換 操做 洗牌操做 背景 性能影響 RDD持久性 選擇哪一個存儲級別? 刪除數據 共享變量 廣播變量 蓄電池 部署到羣集 從Java / Scala啓動Spark做業 單元測試 從這往哪
相關文章
相關標籤/搜索