【Spark開發必備技能】6-1-RDD/Datase/DataFrame-三者定義和關係

目錄 1、RDD是什麼 2、Dataset是什麼 3、DataFrame是什麼 4、使用時候怎麼選 5、三者的入口類 6、三者的轉化 Spark共提供3種基本的數據類型,分別是Spark Core引擎對應的RDD,以及Spark SQL引擎對應的DataFrame 和 DataSet。 那麼三種數據類型的定義是什麼,他們有什麼區別呢? 1、RDD是什麼 分片的集合         RDD(resi
相關文章
相關標籤/搜索