Spark編寫UDAF自定義函數

Hive中有UDF與UDAF,Spark中對UDF支持較早,UDAF:User Defined Aggregate Function。用戶自定義聚合函數,是直到Spark 1.5.x才引入的最新特性。java UDAF,則能夠針對多行輸入,進行聚合計算。 sql 編寫一個實現平均數的UDAFexpress 一、自定義UDAF,須要extends  org.apache.spark.sql.expr
相關文章
相關標籤/搜索