Spark SQL的兩種用戶自定義聚合函數(UDAF)

1、概述 DataFrames的內置函數提供了常見的聚合函數,好比count(), countDistinct(), avg(), max(), min()等,可是這些函數是爲DataFrames而設計的,Spark SQL也有適用於強類型的Datasets的類型安全的函數。此外,用戶也能夠自定義聚合函數。自定義聚合函數有兩種類型,一種是無類型的自定義聚合函數(適用於DataFrame),另外一種
相關文章
相關標籤/搜索