In-memory Processing_01

1.Background 2.Spark 2.1. RDD是Spark框架中的核心概念 。可以將RDD視作數據庫中的一張表。其中可以保存 任何類型的數據。Spark將數據存儲在不同分區 上的RDD之中。 2.2. RDD可以從集合 直接轉換來,也可以由從現存的任何Hadoop InputFormat 來,亦或者 HBase。等等。 2.3. Spark 定義的RDD數據集的存儲級別 如下: MEM
相關文章
相關標籤/搜索