Spark SQL 初始2 之 DataFrame API(2.0)

什麼是DataFrame 1.  DataFrame 是Spark SQL的主要數據抽象(RDD是Spark的主要數據抽象) 是相同模式行的分佈式集合(這些行以命名的列方式組織),等同於關係數據庫的表 支持關係操作(selecting, filtering, aggregating, and plotting structured data)。 2. DataFrame 支持從已存在的原生RDD或
相關文章
相關標籤/搜索