如何提高你的數據分析能力?

第一步:數據準備:(70%時間) 獲取數據(爬蟲,數據倉庫) 驗證數據 數據清理(缺失值、孤立點、垃圾信息、規範化、重複記錄、特殊值、合併數據集) 使用python進行文件讀取csv或者txt便於操作數據文件(I/O和文件串的處理,逗號分隔) 抽樣(大數據時。關鍵是隨機) 存儲和歸檔 第二步:數據觀察(發現規律和隱藏的關聯) 單一變量:點圖、抖動圖;直方圖、核密度估計;累計分佈函數 兩個變量:散點
相關文章
相關標籤/搜索