10種最流行的數據挖掘算法




如下是算法的主要類型。

  1. 分類:
    這些算法將現有數據(或過去的數據)基於其屬性(屬性)放入各類「類」(所以分類)中,並使用該分類數據進行預測。
  2. 迴歸:
    這些算法基於現有數據元素構建數學模型,並使用該模型預測一個或多個數據元素主要用於數字,如利潤,成本,房地產價值等。分類算法和迴歸算法之間的主要區別是迴歸算法中的輸出類型預測數值,而分類算法預測「類標籤」。
  3. 分段或聚類:
    這些算法將數據劃分爲具備類似屬性的項目的組或集羣。
  4. 關聯:
    這些算法在現有數據中的不一樣屬性或屬性之間找到一些關係(技術上稱爲關聯),並嘗試建立用於預測的「關聯」規則。
    算法在數據中查找常常一塊兒出現的項目。
  5. 序列分析:
    這些算法在數據中找到頻繁的序列(例如:網站中的一系列點擊,或者機器故障以前的一系列日誌事件)。
  6. 時間序列:
    這些算法相似於迴歸算法,由於它們預測數值,但時間序列集中於預測有序序列的將來值,而且還包含季節週期(例如:倉庫庫存管理)。
  7. 維度減小算法:
    某些數據集可能包含許多變量,所以幾乎不可能識別對預測有影響的重要變量。
    降維算法有助於識別最重要的變量。
固然,還有許多其餘算法,如隨機森林,GBM,XBoost,GMM,核心近似等,選擇用於特定分析任務的最佳算法多是一個挑戰。
對於相同的業務問題,您可使用不一樣的算法,每種算法產生不一樣的結果,而某些算法能夠產生多種類型的結果。

原文地址:算法

www.dataversity.net/10-most-pop…網站

論文地址:.net

www.cs.uvm.edu/~icdm/algor…
日誌

相關文章
相關標籤/搜索