摘要: 本文簡單總結了機器學習的幾大任務及其對應的方法,方便初學者根據本身的任務選擇合適的方法。當掌握機器學習基本知識以及清楚本身所要處理的任務後,應用機器學習就不會那麼難了。算法
機器學習一直是一個火熱的研究領域,深度學習方法的提出又爲這個領域添了一把火,使得不少人對該領域感興趣並想投身於該領域的研究之中。那麼,對於想從事機器學習領域的人來講,有哪些是應該首先了解的內容呢?本文將簡單的介紹下機器學習的基本相關知識。
機器學習是指使計算機系統使用統計技術學習數據的過程,而不須要具體的編程程序。該方法是一個主動學習的算法,使得它可以從數據中學習並進行預測。機器學習與計算統計、數學優化以及數據學習密切相關,一般被用來進行預測、分析等任務。機器學習通常用於處理兩類任務:編程
機器學習這個術語對於大多非該領域的人來講聽起來很高級,但其實否則。只要你清楚機器學習的基本概念以及相關方法後,機器學習其實很簡單,即根據相關任務,選擇合適的機器學習方法,讓機器學習並處理特徵以完成相應的任務。所以,在學習和應用機器學習以前,咱們首先應該明確本身的任務是什麼,以及適合使用哪一種機器學習方法來完成。
若是咱們想了解算法背後的基本理論以及其工做原理,那麼精通機率與統計、線性代數和微積分對咱們而言顯得相當重要。此外,瞭解諸如Python等編程語言將使你可以容易得實現相關算法,理論基礎與編程能力兩者在手,機器學習我有。此外,理解相關的數學知識和應用也是頗有必要的,不管是經過線下自學或者是網絡在線培訓等學習方法,都必須實踐,實踐能夠增長本身對基本知識的理解,同時也能鍛鍊其編程能力。
在學習機器學習以前,掌握如下知識是頗有必要的:網絡
下面是一些最多見的機器學習任務以及相關方法,對其理解後方便在後續工程中應用。dom
迴歸主要涉及連續變量或數值變量的估計,好比估計房價、股票價格、產品價格等使用迴歸估計。即根據相關的數據創建迴歸曲線,對新的數據進行預測估計。如下機器學習方法用於解決迴歸問題:機器學習
分類與離散變量或數據類別的預測有關。好比區分垃圾郵件、病人患有哪一種疾病、交易是否屬於欺詐行爲等任務,都是使用分類方法處理的。如下方法能夠用於解決分類問題:編程語言
聚類通常應用於數據天然分組。好比產品特徵識別、客戶細分等任務都是聚類的一些應用場景。如下機器學習方法用於聚類問題:學習
多元查詢是用來尋找類似目標。下面的方法可用於解決與多元查詢有關的問題:優化
降維是指下降多個隨機變量的維度,將其分爲特徵提取和特徵選擇。經常使用的降維方法以下:阿里雲
做者信息翻譯
Anusha Manchala,專一於機器學習、數據分析本文由阿里云云棲社區組織翻譯。文章原標題《What You Must Know Before You Dive Into Machine Learning》,譯者:海棠,審校:Uncle_LLD。詳情請閱讀原文