小常識2-機器學習數據預處理

 小常識2-機器學習數據預處理 機器學習裏有一句名言:數據和特徵決定了機器學習的上限,而模型和算法的應用只是讓我們逼近這個上限。   主要包括三部分: 一是獲取數據、數據抽樣 二是數據探索 三是數據預處理與清洗    獲取數據,數據抽樣 如何保證取樣數據的質量?是否在足夠範圍內有代表性?數據樣本取多少合適?如何分類(訓練集、測試集、驗證集)等等。當要處理或者要分析的數據量比較大可以使用抽樣技術:
相關文章
相關標籤/搜索