SparkSQL的兩種UDAF的講解

Spark的dataframe提供了通用的聚合方法,好比count(),countDistinct(),avg(),max(),min()等等。然而這些函數是針對dataframe設計的,固然sparksql也有類型安全的版本,java和scala語言接口都有,這些就適用於強類型Datasets。本文主要是講解spark提供的兩種聚合函數接口:java 1, UserDefinedAggregat
相關文章
相關標籤/搜索