機器學習概覽

細分客戶羣,並未每一個羣體設置最佳的市場策略;
基於類似度來爲每一個顧客推薦產品;
檢測哪些交易最有多是欺詐性的;
預測下一年的收入;算法

機器學習系統的種類網絡

  • 是否在人類監督下訓練(監督式學習、無監督式學習、半監督式學習和強化學習)
  • 是否能夠動態地進行增量學習(在線學習和批量學習)
  • 是簡單地將信的數據點和已知的數據點進行匹配,仍是像科學家那樣,對訓練數據進行模式檢測,而後創建一個預測模型(基於實例的學習和基於模型的學習)

監督式/無監督式學習
根據訓練期間接受的監督數量和監督類型,能夠將機器學習系統分爲如下四個主要類別:dom

  1. 監督式學習
    在監督式學習中,提供給算法的包含所需解決方案的訓練數據,稱爲標籤或標記。機器學習

    a. 分類任務
    b. 迴歸任務:經過預測變量,一組給定的特徵來預測一個目標數值學習

    監督式學習的算法:
     K-近鄰算法(k-Nearest Neighbors)
     線性迴歸(Linear Regression)
     邏輯迴歸(Logistic Regression)
     支持向量機(Support Vector Machines,SVM)
     決策樹和隨機森林(Decision Trees and Random Forests)
     神經網絡(Neural networks)
  2. 無監督式學習
    無監督式學習的訓練數據都是未經標記,系統會在沒有老師的狀況下進行學習。
    a.聚類算法:rest

    k-平均算法(k-Means)
     分層聚類分析(Hierarchical Cluster Analysis,HCA)
     最大指望算法(Expectation Maximization)

    b.可視化和降維:code

    主成分分析(PCA)
     核主成分分析(Kernel PCA)
     局部線性嵌入(LLE)
     t-分佈隨機近臨嵌入(t-SNE)

    c.關聯規則:ci

    Apriori
     Eclat
  3. 半監督式學習
    處理部分標記的訓練數據——一般是大量未標記數據和少許的標記數據。大多數半監督式學習算法是無監督式和監督式算法的結合。
    深度信念網絡(DBN),基於互相堆疊的無監督式組件,這個組件叫作受限玻爾茲曼機(RBM)。受限玻爾茲曼機以無監督的方式進行訓練,而後使用監督式學習對整個系統進行微調。
  4. 強化學習
    它的學習系統(智能體)可以觀察環境,作出選擇,執行操做,並得到回報(reward),或者是以負面回報的形式得到懲罰。因此它必須自行學習什麼是最好的策略,從而隨着時間推移得到最大的回報。策略表明智能體在特定狀況下應該選擇的操做。

批量學習和在線產品

  1. 批量學習
    在批量學習中,系統沒法進行增量學習一一即必須使用全部可用數據進行訓練。因此一般情形下,都是離線完成的。離線學習就是先訓練系統,而後將其投入生產環境,這時學習過程中止,它只是將其所學到的應用出來。
  2. 在線學習
相關文章
相關標籤/搜索