spark-dataset

一個強類型的對象集合,能夠並行地進行轉換。 *使用函數或關係操做。 不一樣於[ [RDD] ]在如下方面: *在內部,由催化劑邏輯計劃表示,數據存儲。 *以編碼形式。此表示容許額外的邏輯操做和 *使許多操做(排序,洗牌,等)進行反序列化到無對象。 *建立一個]須要一個顯式的[能夠][數據集 *用於序列化的對象轉換爲二進制格式。 編碼器也可以映射 *給定對象到星火SQL類型系統的模式。web 與此相
相關文章
相關標籤/搜索
本站公眾號
   歡迎關注本站公眾號,獲取更多信息