【數據挖掘導論】書籍小冊(一)緒論

數據挖掘導論 一、緒論 數據倉庫:一個面向主題的、集成的、相對穩定的、反映歷史變化的數據集合,用於支持決策分析。 數據挖掘是數據庫中知識發現(KDD)不可缺少的一部分,KDD是將未加工的數據轉換爲有用信息的整個過程。如圖: 數據預處理:包括清洗數據以便消除噪聲和重複的觀測值,以及選擇與當前數據挖掘任務相關的記錄和特徵。它是整個知識發現過程中最費力、最耗時的步驟。 後處理:將有效和有用的結果集放到決
相關文章
相關標籤/搜索