119、Spark核心編程進階之集羣架構

時間 2021-01-20

原文原文鏈接

這裏以yarn-cluster集羣架構進行舉例 spark程序寫完了以後，就要提交到spark集羣上面去運行，這就是spark作業（一次代碼的運行+一份數據的處理+一次結果的產出） spark作業是通過spark集羣中的多個獨立的進程來並行運行的，每個進程都處理一部分數據，從而做到分佈式並行計算，才能對大數據進行處理和計算作業在多個進程中的運行，是通過SparkContext對象來居中調度的，該

>>阅读原文<<