(譯)The Ultimate Guide to Data Cleaning-數據清理指南

數據的質量好壞對於最後應用的效果起着重要的影響,垃圾數據絕對產出不了好的結果,但是質量高的數據卻可以彌補算法的軟弱性。 所以瞭解有關數據質量的相關問題。對於我們接下來使用的算法和關鍵,本文博主主要從以下幾個方面講述了有關數據清理的東西。 Data Quality 首先我們來看一下,什麼樣特質的數據可以被稱爲高質量的數據。 Validity(有效性) 我們使用的數據應該滿足某些規則的約束:比如它要滿
相關文章
相關標籤/搜索