Spark大數據分析小白筆記

目錄 一、術語解釋 二、Spark特徵 三、Spark整體工作流程 四、Spark運行方式 一、術語解釋 RDD(Resilient Distributed Dataset):彈性分佈式數據集,是記錄的只讀分區集合,是Spark的基本數據結構。RDD代表一個不可變、可分區、裏面的元素可並行計算的集合。RDD的依賴關係分爲兩種:窄依賴(Narrow Dependencies)、寬依賴(Wide De
相關文章
相關標籤/搜索