數倉基於表級別的數據血緣分析

1.背景:數據血緣分析在日常的處理過程中非常重要,其分爲應用級別、表級別和字段級別三種。在數據處理過程中,需要知道目標表的字段是來源於哪張原始表。對於簡單的hsql來說我們很容易可以知道目標表的來源,但是複雜的hsql,想得到原始表不就那麼方便了。故需要一個方法來便捷的導到目標表和來源表。 2.hive源碼中有名爲NodeProcessor的接口,可以通過實現該接口來獲取表級別的數據血緣分析。 上
相關文章
相關標籤/搜索