因爲本身是統計專業的,而且最近作的項目裏邊涉及到了數據挖掘的知識點,因此就抽出時間來總結一下數據挖掘的知識點,若有不當之處但願各位讀者指正。算法
主要想講一講數據挖掘的概念以及關於數據的一些內容,相對來講,理論內容偏多,但加深對這些東西的認識會讓你在作數據挖掘時更有目的性。spa
定義:在大型數據存儲庫中,自動地發現有用信息的過程。.net
數據挖掘的通常過程包括如下這幾個方面:3d
數據預處理blog
肯定數據集後,就開始對數據進行預處理使得數據可以爲咱們所用了。包括數據清理、數據集成、數據規約和數據變換方法。get
數據挖掘it
一般進行的特徵的構造而後放到特定的模型中去計算,利用某種標準去評判不一樣模型或組合模型的表現,最後肯定一個最合適的模型用於咱們的後處理數據挖掘
後處理class
後處理的過程至關於咱們已經發現了那個咱們想要找到的模式,咱們會去應用它或者用合適的方式將其表示出來。方法
參考連接:https://blog.csdn.net/sinat_22594309/article/details/74923643