CRoss IndustryStandard Process- for Data Mining 跨行業數據挖掘標準流程(下)

因爲篇幅的問題,不得不將一篇文章分三個隨筆來寫。而本文承接前面兩篇文章《跨行業數據挖掘標準流程(上)》、《跨行業數據挖掘標準流程(中)》。欲瞭解前兩篇文章,請參考下面的連接:html

《跨行業數據挖掘標準流程(上)》:http://www.cnblogs.com/ljy2013/p/5542961.html算法

《跨行業數據挖掘標準流程(中)》:http://www.cnblogs.com/ljy2013/p/5543018.htmlhtm

6、模型的評價blog

模型的評價在這裏我給出了幾個評價指標,可是具體的評價仍是須要根據具體的業務場景才能決定。例如:在正負樣本極度不平衡的場景下,通常會選擇AUC做爲模型的評價指標。也有些模型在一些業務場景下須要線上去運行以後,來檢測模型的好壞。部署

7、模型部署get

因爲有些模型分析出來以後,僅僅供領導們來執行決策的一種參考,或者是一種拉風投的一個噱頭;而有一些模型多是跟一些業務有關係,或者是爲了改善某個線上的業務邏輯所創建的,因此須要上線運行。例如:電子商務的推薦算法,金融行業的違約和拒絕模型都須要上線運行。數據挖掘

相關文章
相關標籤/搜索