數據挖掘學習------------------1-數據準備-1-數據收集

1、數據收集 (1.數據源: 並不是把所有的數據都拿過來挖掘,而是選擇與數據挖掘業務目標相關的數據,作爲某次數據挖掘的數據源。 例如:同樣是證劵公司,在精準營銷或服務方面,那麼就要從數據源中選擇客服相關的數據 在量化投資方面,就選擇交易數據、上市公司信息的數據 (2.數據抽樣: 數據具有正確性(代表性和隨機性) 1、單純隨機抽樣:用抽籤法或隨機數法從全體數據中抽取部分數據 2、系統抽樣:又稱機器抽
相關文章
相關標籤/搜索