Spark2.1.0文檔:Spark編程指南-Spark Programming Guide

1 概述 從一個較高的層次來看,每個 Spark 應用程序由兩部分組成:driver program(驅動程序)端運行的 main 函數以及在整個集羣中被執行的各類並行操做。Spark 提供的主要抽象是一個彈性分佈式數據集(RDD),它是能夠被並行處理且跨節點分佈的元素的集合。咱們能夠經過三種方式獲得一個RDDhtml 一、 能夠從一個 Hadoop 文件系統(或者任何其它 Hadoop 支持的文
相關文章
相關標籤/搜索