機器學習的定義:算法
機器學習(Machine Learning, ML)是一門多領域交叉學科,涉及機率論、統計學、逼近論、凸分析、算法複雜度理論等多門學科。專門研究計算機怎樣模擬或實現人類的學習行爲,以獲取新的知識或技能,從新組織已有的知識結構使之不斷改善自身的性能。機器學習
機器學習的應用實例:ide
1.學習關聯性性能
在零售業中,機器學習的應用就是購物籃分析,任務就是發現顧客所購商品之間的關聯性。學習
2.分類編碼
2.1信貸行業,作好風險評估,以及作好銀行貸款問題中的信用評分。還有就是作好預測,經過學習過去的數據,例如收入和存款等,而後預測此客戶的是高風險客戶仍是低風險客戶。code
2.2 機器學習在模式識別中也有應用,其中之一就是光學字符識別(optional character recognition,OCR),即從字符圖像識別字符編碼。文檔
2.3 人臉識別,輸入的是人臉圖像,類是須要識別的人,而且學習程序應當學習人臉圖像與身份之間的關聯性。it
2.4 醫學診斷。輸入的是患者的信息,而類是疾病。io
2.5 語音識別。輸入的是語音,類是能夠讀出的詞彙。語音方面的難題就是每一個人、每一個地域的說話不同。這是將來的研究領域。
2.6 生物測定學,使用人的生理和行爲特徵來識別或認證人的身份,須要集成來自不一樣形態的輸入。生理特徵的例子是面部圖像、指紋、虹膜和手掌;行爲特徵的例子是:簽字的力度、嗓音、步態和擊鍵。
2.7 機器學習還能夠進行壓縮,用規則擬合數據,可以獲得比數據更簡單的解釋,須要的存儲空間更少,處理須要的計算更少。
2.8 離羣點檢測,即發現哪些不遵照規則的例外實例。
3. 迴歸
機器學習的應用例子:對機器人的導航,例如如今的自動駕駛汽車導航。
4. 非監督學習
在監督學習中,目標是學習從輸入到輸出的映射關係,其中的輸出是正確值已經由指導者提供。
非監督學習是沒有指導者,單純只有輸入數據,目標是發現輸入的數據中的規律。
密度估計的概念:
輸入空間存在某種結構,使得特定的模式比其餘的模式更常出現,而咱們但願知道哪些常發生,那些不常發生,在統計學中,稱之爲密度估計(Density estimation)
密度估計的方法:聚類———目標是發現輸入數據的蔟和分組。
聚類的應用之一————圖像壓縮,輸入實例是由RGB值表示的圖像像素。
在文本聚類中,目標是把類似的文檔分組。
5. 增長學習
機器學習程序就是應當可以評估策略的好壞程度,並從以往的動做序列中學習,以便可以產生策略,這種學習方法稱之爲加強學習(Reinforcement learning)算法。
參考書籍:《機器學習導論》
歡迎關注個人公衆號:爬數AI先生
我的學習筆記文章若有錯誤之處,歡迎你們指出。謝謝~~