Spark 共享變量——累加器(accumulator)與廣播變量(broadcast variable)

累加器(accumulator) 咱們傳遞給Spark的函數,如map(),或者filter()的判斷條件函數,可以利用定義在函數以外的變量,可是集羣中的每個task都會獲得變量的一個副本,而且task在對變量進行的更新不會被返回給driver。而Spark的兩種共享變量:累加器(accumulator)和廣播變量(broadcast variable),在廣播和結果聚合這兩種常見類型的通訊模式上
相關文章
相關標籤/搜索