機器學習裏數據預處理及特徵工程總結

         機器學習裏有一句名言:數據和特徵決定了機器學習的上限,而模型和算法的應用只是讓咱們逼近這個上限。這個說法形象且深入的提出前期數據處理和特徵分析的重要性。這一點從咱們每每用整個數據挖掘全流程60%以上的時間和精力去作建模前期的數據處理和特徵分析也能看出。那麼疑問來了,這超過60%時間和精力咱們都用在哪了?本文基於以往的知識儲備以及實際的項目經驗,我作一個總結。算法        
相關文章
相關標籤/搜索