《Spark快速大數據分析》筆記第三章RDD編程

時間 2021-07-14

標籤大數據 spark 欄目 Spark 简体版

原文原文鏈接

以下內容均摘抄自《Spark快速大數據分析》運行規則總的來說，每個 Spark 程序或 shell 會話都按如下方式工作。從外部數據創建出輸入 RDD。使用諸如 filter() 這樣的轉化操作對 RDD 進行轉化，以定義新的 RDD。告訴 Spark 對需要被重用的中間結果 RDD 執行 persist() 操作。使用行動操作（例如 count() 和 first() 等）來觸發一次

>>阅读原文<<