做Data Mining,其實大部分時間都花在清洗數據

前言:很多初學的朋友對大數據挖掘第一直觀的印象,都只是業務模型,以及組成模型背後的各種算法原理。往往忽視了整個業務場景建模過程中,看似最普通,卻又最精髓的特徵數據清洗。可謂是平平無奇,卻又一掌定乾坤,稍有閃失,足以功虧一簣。  大數據圈裏的一位掃地僧 說明:這篇文章很早就想寫了,但是切入點一直拿捏不準,要講的內容比較大衆化,卻又是重中之重。 一、數據清洗的那些事 構建業務模型,在確定特徵向量以後,
相關文章
相關標籤/搜索