理解RDD、DataFrame、Dataset區別

理解RDD、DataFrame、Dataset區別 文章轉載自https://www.jianshu.com/p/8ab678331d95 rdd 優點 1.強大,內置很多函數操作,group,map,filter等,方便處理結構化或非結構化數據 2.面向對象編程,直接存儲的java對象,類型轉化也安全 缺點 1.由於它基本和hadoop一樣萬能的,因此沒有針對特殊場景的優化,比如對於結構化數據處
相關文章
相關標籤/搜索