Python-sklearn機器學習的第一個樣例(5)

Step 5: 分類 雖然數據清理令人厭煩,但它卻是數據分析的關鍵步驟。如果我們跳過這個階段直接進入建模,會導致錯誤的數據模型。 記住:錯誤的數據導致錯誤的模型。永遠要從檢查數據開始。 現在我們已經儘可能地把數據清洗了,並且對數據集的分佈和關係有了初步的認識。接下來的重要步驟就是把數據集分爲:訓練集和測試集。 訓練集是數據集的一個隨機子集,用於訓練模型。 測試集也是數據集的一個隨機子集(與訓練集互
相關文章
相關標籤/搜索