SparkCore 累加器和廣播變量(Spark編程進階)

    本章介紹前幾章沒有說起的 Spark 編程的各類進階特性,會介紹兩種類型的共享變量: 累加器(accumulator)與廣播變量(broadcast variable)。累加器用來對信息進行聚合,而 廣播變量用來高效分發較大的對象。在已有的 RDD 轉化操做的基礎上,咱們爲相似查詢 數據庫這樣須要很大配置代價的任務引入了批操做。爲了擴展可用的工具範圍,本章會介 紹 Spark 與外部程序交
相關文章
相關標籤/搜索