DataFrame與RDD的區別

結合上圖進行理解: RDD與DataFrame都是分佈式的 可以並行處理的 一個集合 但是DataFrame更像是一個二維表格,在這個二維表格裏面,我們是知道每一列的名稱 第一列是Name,它的類型是String 第二列是Age,它的類型是Int 第三列是Height,它的類型是Double 而對於DataFrame來說,它不僅可以知道里面的數據,而且它還可以知道里面的schema信息 因此能做的
相關文章
相關標籤/搜索