數據治理中 PyODPS 的正確使用方式

數據治理中 PyODPS 的正確使用方式 概述:表飽和度(字段是否爲空)、字段閾值(數值類字段取值是否超出有效邊界)是評估數據質量的關鍵指標,因爲是單表內字段級別的校驗和統計,而且幾乎涉及全部表,範圍大、邏輯簡單、重複性強,結合 Python 開發效率高的特色,不少數據工程師會使用 PyODPS 進行相關功能的開發。本文基於 PyODPS 分別使用 3 種方式實現了「飽和度統計」功能,展現了它們的
相關文章
相關標籤/搜索