機器學習:完整機器學習項目流程,數據清洗

一、完整機器學習項目流程 數學抽象--任務目標 明確問題是進行機器學習的第一步。機器學習的訓練過程通常都是一件非常耗時的事情,胡亂嘗試時間成本是非常高的。 這裏的抽象成數學問題,指的是根據數據明確任務目標,是分類、還是迴歸,或者是聚類。 數據獲取--數據集 數據決定了機器學習結果的上限,而算法只是儘可能逼近這個上限。 數據要有代表性,否則必然會過擬合。 對於分類問題,數據偏斜不能過於嚴重(平衡),
相關文章
相關標籤/搜索