sparkSql(hive) 複合數據類型的使用

在Hive中能夠使用複合數據類型,有三種經常使用的類型:Array 數組,Map 字典,Struct結構。在sparkSql中RDD能夠轉換成很是靈活的DataFrame,有下面幾種語法:sql rdd=sc.parallelize([1,2,3])數組 a=rdd.map(lambda item:Row(item))數據結構 schema=['test_colum']app a=a.toDF(s
相關文章
相關標籤/搜索