【十二】Spark SQL DataSets概述

DataSet是一個分佈式的數據集,是spark1.6版本纔出來的。它提供RDD中的有點(強類型、lambda表達式、優化SparkSQL執行引擎)。DataFrame中能用的東西大部分在DataSet都能用。DataSet能夠通過JVM對象構建出來。DataSet能使用函數表達式(map、flatmap、filter等等)。DataSet API能在Java和Scala中使用。python暫不支
相關文章
相關標籤/搜索