統計學習:關於計算機基於數據構建機率統計模型進行預測分析的一門學科,也稱統計機器學習(statistial machine learning)算法
特色:網絡
以激素那幾及網絡爲平臺機器學習
以數據爲研究對象函數
目的是對數據進行預測和分析性能
什麼什麼什麼的交叉學科學習
統計學習就是計算機系統經過運用數據及統計方法提升系統性能的機器學習。對象
統計學習的研究對象:數據數據分析
提取數據特徵,抽象出數據模型,回到對 數據的分析和預測中去it
基本假設;同類數據具備必定的統計規律io
統計學習的目的
用於數據分析與預測
統計學習的方法
基於數據構建機率統計模型從而對數據進行預測與分析
統計學習由監督學習(supervised learning),無監督學習(unsupervised learning),強化學習(reinforcement learning)等組成
統計學習方法歸納:
從給定的,有限的,用於學習的訓練數據(training data)集合出發,假設數據是獨立同分布的;
假設要學習的模型屬於某個函數的集合,稱爲假設空間
應用於某個評價準則(evalution criterion),從假設空間中選取一個最優模型,使它對使它對已知的訓練數據(training data)和未知的預測數據(test data)在給定的評
價下有最優的預測;
最優的模型的選取由算法實現
模型的假設空間,模型選擇的準則,模型學習的算法 稱爲統計學習算法的三要素模型(model),策略(strategy),算法(algorithm)
實現統計學習方法的步驟:
(1)獲得一個有限的訓練數據集合;
(2)肯定包含全部可能的模型的假設空間,即學習模型的集合;
(3)肯定模型選擇的準則,即需欸的策略
(4)實現求解最優模型的算法,即學習的策略;
(5)經過學習算法選擇最優模型
(6)利用學習的最優模型對新數據進行預測或分析。
監督學習方法:
分類,標註,迴歸問題(天然語言處理,信息檢索文本挖掘)
統計學習的研究:
統計學習方法,統計學習理論,統計學習應用
統計學習的重要性:
處理海量數據,計算機智能化,計算機科學