自從計算機出現後,大量的數據都存儲在計算機中,尤爲是今幾年提出的"大數據",更是意味着存儲在計算機中存儲算法
單位達到PB級。那如何對這些數據進行處理,對於簡單的需求可能只須要對數據進行統計便可。但當數據變得複雜瀏覽器
或有更高的需求時,就須要使用到機器學習。安全
這篇文章就是簡單介紹對機器學習的認識。機器學習
機器學習,英文名稱(Machine Learning),簡稱ML。顧名思義,它是說機器也就是計算機像人同樣進行"學習",但計算機怎麼會學習呢?那首先讓咱們思考一下人類是怎麼進行學習的,咱們人類是經過對外界的知識的不斷積累,包括對傳授者的行爲信息或書本的信息經過五官進行獲取,而後大腦對信息進行處理,最後造成經驗。那計算機如何進行學習呢,雖然計算機看上去計算數據很快,但其實很笨,那如何使笨笨的計算機進行學習呢?與人類學習同樣,計算機使用大量已有的數據,對計算機訓練出模型,並用該模型得出有用的信息。個人我的理解,機器學習是以潛在的模型將無序的數據轉換成有用的信息。工具
按照常見的學習方式分類,可以將機器學習分爲:監督式學習、無監督學習、半監督學習、強化學習。下面是常見的幾種算法:學習
監督學習 | K-近鄰算法、線性迴歸、樸素貝葉斯、SVM、決策樹、Logistic迴歸... |
無監督學習 | K-均值、最大指望算法... |
強化學習 | TD算法、Q算法... |
機器學習已經應用於多個領域,舉一個常見的例子,當你打開瀏覽器搜索一件商品,瀏覽器顯示10條連接,你點擊了第3條連接,搜索引擎後臺就會記錄你的此次點擊,並從中學習以優化下次的搜索結果,當你進行下一次搜索時,可能會有上次搜索商品對應的廣告或搜索結果。這其中就是典型的機器學習應用,當用戶使用智能手機進行自拍時,有些手機就能進行人臉識別,鎖定人的頭像。機器學習應用多個領域,如改善商業決策、檢測疾病、預測天氣、信息安全、生物信息等。大數據
數據挖掘是指從大量數據中挖掘有趣模式和知識的過程。從數據自己來考慮,數據挖掘一般須要有信息收集、數據集成、數據規約、數據清理、數據變換、數據挖掘實施過程、模式評估和知識表示8個步驟。而機器學習是數據挖掘的一種方法。數據挖掘還包含其餘的諸如統計學、模式識別、數據倉庫等技術。優化
大數據(BigData)是指沒法在可承受的時間範圍內用常規軟件工具進行捕捉、管理和處理的數據集合。大數據的5V特徵:Volume(大量)、Velocity(高速)、Variety(多樣)、Value(價值)、Veracity(真實性)。大數據的核心是利用數據的價值,機器學習是利用數據價值的關鍵技術,對於大數據而言,機器學習是不可或缺的。大數據與機器學習二者是相輔相成的關係。搜索引擎