hive: 自定義UDTF

在hive項目中, 有client和server通信的log日誌體系如下,中間的網絡傳輸使用的json格式,所以在server端接收時需要使用阿里的fastJSON來解析爲日誌聚合體LogAgg類;然後使用自定義表生成函數UDTF, 分別取出Error表, Event表,StartUp表的數據, 數據轉儲到各表中,完成日誌的初步ETL。 所以,這個UDTF如何定義? 類似於上篇的自定義UDF函數,
相關文章
相關標籤/搜索