Hive自定義UDAF詳解

遇到一個Hive需求:有A、B、C三列,按A列進行聚合,求出C列聚合後的最小值和最大值各自對應的B列值。這個需求用hql和內建函數也可完成,可是比較繁瑣,會解析成幾個MR進行執行,若是自定義UDAF即可只利用一個MR完成任務。 所用Hive爲0.13.1版本。UDAF有兩種,第一種是比較簡單的形式,利用抽象類UDAF和UDAFEvaluator,暫不作討論。主要說一下第二種形式,利用接口Gener
相關文章
相關標籤/搜索