Hive表類型及使用技巧-拉鍊表

拉鍊表 一、數據加工和維護 概念: 所謂拉鍊表就是記錄一個事物從開始 一直到當前狀態的所有變化信息;通過比較,記錄數據的生命週期,能夠快速還原任意天的歷史快照,而非全量的每天記錄所有數據,因此極大節省了存儲。 一般表名後面xxx_chain 數據加工方式: (1)拉鍊表中一般會存在一個字段「start_date」表示該記錄的起始時間,不代表創建時間,非業務時間。一把會存在"createtime"表
相關文章
相關標籤/搜索