spark

每日積累 RDD (Spark1.0) —> Dataframe(Spark1.3) —> Dataset(Spark1.6) DataFrame, DataSet DataFrame:類似RDD,是一個分佈式數據容器;除數據以外,記錄了數據的結構信息,即schema。 DataFrame和RDD的區別 例如RDD[User] spark不知道User的內部結構,然而DataFrame提供了具體的
相關文章
相關標籤/搜索