Hive實現自增列的兩種方法

  多維數據倉庫中的維度表和事實表通常都須要有一個代理鍵,做爲這些表的主鍵,代理鍵通常由單列的自增數字序列構成。Hive沒有關係數據庫中的自增列,但它也有一些對自增序列的支持,一般有兩種方法生成代理鍵:使用row_number()窗口函數或者使用一個名爲UDFRowSequence的用戶自定義函數(UDF)。   假設有維度表tbl_dim和過渡表tbl_stg,如今要將tbl_stg的數據裝載到
相關文章
相關標籤/搜索