數據挖掘學習路線【轉知乎某人的觀點】

---------------------------濃縮精華版-------------------------------- 第一步:數據準備:(70%時間) 獲取數據(爬蟲,數據倉庫) 驗證數據 數據清理(缺失值、孤立點、垃圾信息、規範化、重複記錄、特殊值、合併數據集) 使用python進行文件讀取csv或者txt便於操做數據文件(I/O和文件串的處理,逗號分隔) 抽樣(大數據時。關鍵是隨機
相關文章
相關標籤/搜索