數據預處理——是髒活、累活,卻也價值無限

當有大企業爲數據進行爭論時,我們再一次感慨數據的價值。自從大數據一詞被提出之後,我們無時無刻不再提醒着自己,累積了越多的數據,就越能手握金礦。在機器學習、深度神經網絡開始走向大衆視野之後,我們更加自豪,彷彿分分鐘能從自己的數據中誕生個什麼算法。 事實上,針對於機器學習應用範疇看來,絕大部分企業所謂的大數據,都只是一大堆佔據着儲存空間的垃圾。 因爲,這些大數據都是未經清洗、處理過的髒數據,完全不足以
相關文章
相關標籤/搜索