緩慢變化維之拉鍊表

場景: 業務庫中的訂單表中的某些維度隨着時間的推移會慢慢變化,如果對於每次變化都是對原有數據的覆蓋,則無法看到歷史信息 對於這種情況,可以使用拉鍊表來解決。 相比於每天全量的導出業務數據到hive中存備份,使用拉鍊表的好處就是減少大量的冗餘數據,並且也可以達到查看歷史信息。 實現:  第一次從業務庫中導入全量數據到hive中作爲初始化的拉鍊表A,且增加兩個字段:有效時間起(start_time)和
相關文章
相關標籤/搜索