ML科普系列(二)分類與迴歸

前言

在機器學習中,「分類」和「迴歸」這兩個詞常常據說,但不少時候咱們卻混爲一談。本文主要從應用場景、訓練算法等幾個方面來敘述二者的區別。算法

 本質區別

分類和迴歸的區別在於輸出變量的類型。分類的輸出是離散的,迴歸的輸出是連續的。網絡

定量輸出稱爲迴歸,或者說是連續變量預測; 定性輸出稱爲分類,或者說是離散變量預測。機器學習

若咱們欲預測的是離散值,例如"好瓜""壞瓜",此類學習任務稱爲 "分類"。
若欲預測的是連續值,例如西瓜的成熟度0.95 ,0.37,此類學習任務稱爲"迴歸"。函數

                                                                                                              《機器學習》周志華著學習

分類就是想辦法讓一堆數據站隊,找出最符合其自身特徵的羣體。blog

例:有羣體y=x和y=-x,數據集(1,1) (-2,2) (3,-3) (-4,-4)... (n,n),(1,1),(-4,-4)就符合羣體y=x,(-2,2) (3,-3)就符合羣體y=-x。圖片

迴歸就是數學意義上的找出一個函數,讓某些數據儘可能符合這個函數的特徵。例如線性迴歸(Linear Regression,LR)。數學

例:(1,1) (2,2) (3,3) ... (n,n)這些數據迴歸後的結果就是函數 y = x。產品

 舉例說明:io

  • 預測明天的氣溫是多少度,這是一個迴歸任務;
  • 預測明天是陰、晴仍是雨,就是一個分類任務。

應用場景

分類問題

分類問題是用於將事物打上一個標籤,一般結果爲離散值。例如判斷一幅圖片上的動物是一隻貓仍是一隻狗,分類一般是創建在迴歸之上,分類的最後一層一般要使用softmax函數進行判斷其所屬類別。

分類並無逼近的概念,最終正確結果只有一個,錯誤的就是錯誤的,不會有相近的概念。最多見的分類方法是邏輯迴歸,或者叫邏輯分類。

迴歸問題

迴歸問題一般是用來預測一個值,如預測房價、將來的天氣狀況等等,例如一個產品的實際價格爲500元,經過迴歸分析預測值爲499元,咱們認爲這是一個比較好的迴歸分析。

一個比較常見的迴歸算法是線性迴歸算法(LR)。另外,迴歸分析用在神經網絡上,其最上層是不須要加上softmax函數的,而是直接對前一層累加便可。迴歸是對真實值的一種逼近預測。

總結

解決的問題類型

分類問題是從不一樣類型的數據中學習到這些數據間的邊界,好比經過魚的體長、重量、魚鱗色澤等維度來分類鮎魚和鯉魚,這是一個定性問題

迴歸問題則是從同一類型的數據中學習到這種數據中不一樣維度間的規律,去擬合真實規律,好比經過數據學習到面積、房間數、房價幾個維度的關係,用於根據面積和房間數預測房價,這是一個定量問題

相關文章
相關標籤/搜索