SparkSQL 自定義算子UDF、UDAF、UDTF

背景java 我根據算子輸入輸出之間的關係來理解算子分類:web UDF——輸入一行,輸出一行 UDAF——輸入多行,輸出一行 UDTF——輸入一行,輸出多行sql 本文主要是整理這三種自定義算子的具體實現方式 使用的數據集——用戶行爲日誌user_log.csv,csv中自帶首行列頭信息,字段定義以下: 1. user_id | 買家id 2. item_id | 商品id 3. cat_id
相關文章
相關標籤/搜索