第5章 RDD編程進階

時間 2020-05-08

標籤 rdd 編程進階欄目 Spark 简体版

原文原文鏈接

上篇：第4章大數據Spark鏈接HBase數據讀取與保存java Spark 三大數據結構 RDD：分佈式數據集廣播變量：分佈式只讀共享變量累加器：分佈式只寫共享變量web 一、累加器累加器用來對信息進行聚合，一般在向 Spark傳遞函數時，好比使用 map() 函數或者用 filter() 傳條件時，可使用驅動器程序中定義的變量，可是集羣中運行的每一個任務都會獲得這些變量的一份新的副本

>>阅读原文<<