數據錄入->數據採集->數據清洗(優化策略)

[html]  view plain  copy 最近聽大神講到對於項目的見解,因此以爲收穫頗多,因此在這裏作個筆記,順便分享給你們 我這裏負責的是數據清洗的工做,有些時候,數據導入量很是大,達到幾千萬,幾億的數據量 因此對於這些大數據量的數據清洗,既須要效率,有須要質量,因此這是一個很是龐大的工做 總而言之就是:從源頭控制數據質量,從源頭進行數據清洗,就會減輕後面的工做量
相關文章
相關標籤/搜索