Spark 共享變量

Spark中有兩種類型的共享變量:一個是累加器accumulator、一個是廣播變量broadcast variable。java 累加器:用來對信息進行聚合 廣播變量:用來高效分發較大的對象web 一. 累加器 累加器的一個常見用途是在調試時對做業執行過程當中的事件進行計數,如:統計日誌中空行數、統計錯誤行數等。apache 用法: 經過調用JavaSparkContext.accumulato
相關文章
相關標籤/搜索