【大數據技術分享】數據清理的終極指南

我花了幾個月的時間分析來自傳感器、調查及日誌等相關數據。無論我用多少圖表,設計多麼複雜的算法,結果總是會與預期不同。更糟糕的是,當你向首席執行官展示你的新發現時,他/她總會發現缺陷,你的發現與他們的理解完全不符- 畢竟,他們是比你更瞭解領域的專家,而你只是數據工程師或開發人員。 你爲你的模型引入了大量髒數據,沒有清理數據,你告訴你的公司用這些結果做事情,結果肯定是錯的。數據不正確或不一致會導致錯誤
相關文章
相關標籤/搜索