《數據挖掘:實用案例分析》
基本信息
做者: 張良均 陳俊德 劉名軍 陳榮
叢書名: 大數據技術叢書
出版社:機械工業出版社
ISBN:9787111425915
上架時間:2013-7-4
出版日期:2013 年7月
開本:16開
頁碼:1
版次:1-1
所屬分類:計算機 > 數據庫 > 數據庫存儲與管理
內容簡介
計算機書籍
《數據挖掘:實用案例分析》是數據挖掘實戰領域頗具特點的一部做品,做者曾爲10餘個行業上百家大型企業提供數據挖掘服務,本書是其在數據挖掘領域探索近10年的經驗總結之做。全書以實踐和實用爲宗旨,深度與廣度兼顧,實踐與理論並舉。
《數據挖掘:實用案例分析》共12章,分三個部分。第一部分是基礎篇(第1~4章),主要對數據挖掘的基本概念、應用分類、建模方法及經常使用的建模工具進行了介紹,並對本書所用到的數據挖掘建模平臺tipdm進行了說明。第二部分是實戰篇(第5~10章),以案例的形式對數據挖掘技術在金融、電信、電力、互聯網、生產製造以及公共服務等行業的應用場景進行了討論;首先介紹案例背景,而後闡述分析方法與過程,最後完成模型構建;在介紹建模過程的同時穿插操做訓練,把相關的知識點嵌入相應的操做過程當中;此外,第10章精心設計了6個實驗項目,讀者能夠經過本章介紹的方法動手實踐,以鞏固數據挖掘知識,在分析建模過程的同時,進一步加強動手能力。第三部分是高級篇(第11~12章),主要介紹基於第三方接口的數據挖掘二次開發技術,重點對經常使用的weka和matlab數據挖掘算法接口進行了探討;最後對基於hadoop框架的海量數據挖掘進行了說明,以知足讀者更高層次的需求。
隨書光盤中提供了本書的相關資料和案例資源,以及6個動手實驗所使用的完整數據,方便讀者動手實踐書中所講解的案例。
目錄
《數據挖掘:實用案例分析》
前 言
第一部分 基 礎 篇
第1章 初識數據挖掘2
1.1 什麼是數據挖掘2
1.2 數據挖掘在企業商務智能應用中的定位2
1.2.1 數據挖掘給企業帶來最大的投資收益3
1.2.2 數據挖掘從本質上提高商務智能平臺的價值3
1.2.3 數據挖掘讓商務智能流程真正造成閉環4
1.3 信息類bi應用與知識類bi應用5
1.4 數據挖掘現狀及應用前景5
1.5 本章小結7
第2章 數據挖掘的應用分類8
2.1 分類與迴歸8
2.1.1 分類與迴歸建模原理9
2.1.2 分類與迴歸算法10
2.2 聚類11
2.2.1 聚類分析建模原理11
2.2.2 聚類算法12
2.3 關聯規則13
.2.3.1 什麼是關聯規則13
2.3.2 關聯規則算法14
2.4 時序模式14
2.4.1 什麼是時序模式14
2.4.2 時間序列的組合成分15
2.4.3 時間序列的組合模型15
2.4.4 時序算法16
2.5 誤差檢測16
2.6 本章小結17
第3章 數據挖掘建模18
3.1 數據挖掘的過程18
3.2 數據挖掘建模過程18
3.2.1 定義挖掘目標18
3.2.2 數據取樣19
3.2.3 數據探索20
3.2.4 預處理21
3.2.5 模式發現23
3.2.6 模型構建23
3.2.7 模型評價24
3.3 經常使用的建模工具27
3.4 本章小結29
第4章 頂尖數據挖掘平臺tipdm31
4.1 tipdm產品功能31
4.1.1 tipdm平臺提供的數據探索及預處理算法31
4.1.2 tipdm平臺提供的分類與迴歸算法32
4.1.3 tipdm平臺提供的時序模式算法34
4.1.4 tipdm平臺提供的聚類分析算法35
4.1.5 tipdm平臺提供的關聯規則算法35
4.2 tipdm使用說明37
4.3 tipdm產品特色39
4.3.1 支持crisp-dm數據挖掘標準流程39
4.3.2 提供豐富的數據挖掘模型和靈活算法40
4.3.3 具備多模型的整合能力40
4.3.4 提供靈活多樣的應用開發接口40
4.3.5 海量數據的處理能力40
4.3.6 適應不一樣類型層次人員需求41
4.4 本章小結42
第二部分 實 戰 篇
第5章 數據挖掘在金融電信行業的應用44
5.1 案例一:基於公司價值評價的證券策略投資44
5.1.1 挖掘目標的提出44
5.1.2 分析方法與過程44
5.1.3 建模仿真51
5.1.4 核心知識點52
5.1.5 拓展思考53
5.2 案例二:電信3g客戶識別系統54
5.2.1 挖掘目標的提出54
5.2.2 分析方法與過程54
5.2.3 建模仿真58
5.2.4 核心知識點61
5.2.5 拓展思考63
5.3 案例三:基於客戶分羣的精準智能營銷64
5.3.1 挖掘目標的提出64
5.3.2 分析方法與過程65
5.3.3 建模仿真75
5.3.4 核心知識點81
5.3.5 拓展思考82
5.4 本章小結83
第6章 數據挖掘在電力行業的應用84
6.1 案例一:電力負荷預測84
6.1.1 挖掘目標的提出84
6.1.2 分析方法與過程85
6.1.3 建模仿真90
6.1.4 核心知識點94
6.1.5 拓展思考95
6.2 案例二:自適應防竊漏電實時診斷96
6.2.1 挖掘目標的提出96
6.2.2 分析方法與過程96
6.2.3 建模仿真107
6.2.4 核心知識點110
6.2.5 擴展思考111
6.3 本章小結112
第7章 數據挖掘在互聯網行業的應用113
7.1 案例一:商業零售行業中的購物籃分析113
7.1.1 挖掘目標的提出113
7.1.2 分析方法與過程113
7.1.3 建模仿真118
7.1.4 核心知識點120
7.1.5 拓展思考121
7.2 案例二:電子商務網站用戶行爲分析124
7.2.1 挖掘目標的提出124
7.2.2 分析方法與過程124
7.2.3 建模仿真129
7.2.4 核心知識點132
7.2.5 拓展思考132
7.3 案例三:網絡入侵智能檢測134
7.3.1 挖掘目標的提出134
7.3.2 分析方法與過程136
7.3.3 建模仿真137
7.3.4 核心知識點141
7.3.5 拓展思考141
7.4 案例四:基於用戶行爲分析的定向網絡廣告投放142
7.4.1 挖掘目標的提出142
7.4.2 分析方法與過程143
7.4.3 建模仿真146
7.4.4 結果及分析158
7.4.5 核心知識點159
7.4.6 拓展思考160
7.5 案例五:企業信息系統用戶服務感知評價161
7.5.1 挖掘目標的提出161
7.5.2 分析方法與過程161
7.5.3 建模仿真186
7.5.4 核心知識點192
7.5.5 拓展思考193
7.6 本章小結194
第8章 數據挖掘在生產製造行業中的應用195
8.1 案例一:基於小波變換的樁基完整性檢測195
8.1.1 挖掘目標的提出195
8.1.2 分析方法與過程196
8.1.3 仿真過程202
8.1.4 核心知識點204
8.1.5 拓展思考204
8.2 案例二:基於水色圖像的水質評價205
8.2.1 挖掘目標的提出205
8.2.2 分析方法與過程206
8.2.3 建模仿真210
8.2.4 核心知識點213
8.2.5 拓展思考214
8.3 案例三:生物質廢物混合厭氧消化優點組分互補機制216
8.3.1 挖掘目標的提出216
8.3.2 分析方法與過程217
8.3.3 建模仿真221
8.3.4 核心知識點223
8.3.5 拓展思考224
8.4 案例四:基於rfm的企業客戶關係分析224
8.4.1 挖掘目標的提出224
8.4.2 分析過程與方法226
8.4.3 建模仿真229
8.4.4 核心知識點236
8.4.5 拓展思考236
8.5 案例五:水產養殖投入產出多目標優化仿真239
8.5.1 挖掘目標的提出239
8.5.2 分析方法與過程240
8.5.3 建模仿真244
8.5.4 核心知識點249
8.5.5 拓展思考250
8.6 本章小結252
第9章 數據挖掘在公共服務行業的應用253
9.1 案例一:乳腺癌證素變化規律及截斷療法253
9.1.1 挖掘目標的提出253
9.1.2 分析方法與過程255
9.1.3 建模仿真265
9.1.4 核心知識點274
9.1.5 拓展思考274
9.2 案例二:捲菸消費者購買行爲分析277
9.2.1 挖掘目標的提出277
9.2.2 分析過程與方法278
9.2.3 挖掘建模281
9.2.4 核心知識點287
9.2.5 拓展思考288
9.3 案例三:納稅人偷漏稅評估288
9.3.1 挖掘目標的提出288
9.3.2 分析方法與過程290
9.3.3 建模仿真294
9.3.4 核心知識點300
9.3.5 拓展思考301
9.4 案例四:道路缺陷自動識別302
9.4.1 挖掘目標的提出302
9.4.2 分析方法與過程304
9.4.3 建模仿真319
9.4.4 核心知識點322
9.4.5 拓展思考322
9.5 案例五:航空公司客運信息挖掘322
9.5.1 挖掘目標的提出322
9.5.2 分析方法與過程323
9.5.3 建模仿真327
9.5.4 核心知識點348
9.5.5 拓展思考352
9.6 本章小結353
第10章 動手實踐354
10.1 實驗一:數據探索及數據預處理354
10.2 實驗二:神經網絡模型的構建與使用356
10.3 實驗三:決策樹模型的構建與使用358
10.4 實驗四:聚類算法的構建與使用360
10.5 實驗五:關聯規則模型的構建與使用361
10.6 實驗六:時間序列模型的構建與使用363
10.7 本章小結364
第三部分 高 級 篇
第11章 基於第三方接口的數據挖掘二次開發366
11.1 weka數據挖掘接口366
11.1.1 weka功能及其算法366
11.1.2 weka包結構367
11.1.3 weka算法入口370
11.1.4 二次開發相關輸出370
11.2 matlab數據挖掘接口370
11.3 案例:基於matlab接口的數據挖掘二次開發372
11.3.1 接口算法編程372
11.3.2 用java builder建立java組件385
11.3.3 安裝matlab運行時環境386
11.3.4 jdk環境及設置386
11.4 本章小結389
第12章 基於hadoop框架的海量數據挖掘開發390
12.1 基於雲計算的海量數據挖掘技術特色390
12.2 基於hadoop的並行數據挖掘算法工具箱tipcdm392
12.3 案例:基於海量計量數據的電力客戶在線分羣方法392
12.3.1 挖掘目標的提出392
12.3.2 分析方法與過程393
12.3.3 建模仿真399
12.3.4 核心知識點400
12.4 本章小結401
參考文獻402