數據科學家要做的事情-對機器學習本質的思考

數據科學 數據科學 扯白了說就是拿到數據後,如何最有效利用這些數據去解決一個問題,使用數據來解決一個實際問題的學問就稱之爲數據科學。 數據科學主要牽扯到這幾個方面:        (1)數據獲取:主要利用爬蟲和數據庫技術找到和存儲數據。        (2)數據處理:識別出髒數據、填充空缺數據、將數據形式進行轉化成模型能接受的輸入。        (3)特徵工程:根據原始數據【原始數據每一項稱爲一
相關文章
相關標籤/搜索