Ng機器學習筆記-1-一元線性迴歸

時間 2019-11-11

標籤機器學習筆記一元 1元線性迴歸欄目應用數學简体版

原文原文鏈接

一：迴歸模型介紹算法

從理論上講，迴歸模型即用已知的數據變量來預測另一個數據變量，已知的數據屬性稱爲輸入或者已有特徵，想要預測的數據稱爲輸出或者目標變量。機器學習

下圖是一個例子：函數

圖中是某地區的面積大小與房價的關係圖，輸入變量X是面積，輸出變量Y是房價，把已有的數據集(x,y)做爲一個訓練數據，擬合出線性迴歸模型，利用線性迴歸模型預測出一給定面積房子的價格。學習

下圖1-3是典型的學習過程圖1-3 學習過程測試

其中，h是估計函數，對應到線性迴歸中就是一個線性關係式，輸入變量x，通過估計函數，輸出相應的估計值y。spa

二：代價函數3d

在一元線性迴歸中有兩個參數：theta0，theta1的值是未知的，這兩個參數的值決定了估計函數的好壞。估計值與真實值y之間的差越小，說明估計函數越好，所以，選擇參數theta0，theta1的標準就設爲，選擇可以使得函數J（theta0,theta1）獲得最小值的一對參數（theta0，theta1）做爲最終的參數值。咱們稱函數blog

J（theta0,theta1）爲代價函數。get

下面進行舉例分析，爲方便理解代價函數和線性迴歸估計函數，先假設theta0=0，即，給定三組訓練數據（1,1）、（2,2）、（3,3），如今訓練一線性迴歸估計函數，使得它可以最大限度的磨合訓練數據，即目標是求得參數theta1的值，使得代價函數值最小，以下圖所示：同步

左圖是不一樣theta1值對應的估計函數線性圖，右圖是不一樣theta1對應的代價函數值，能夠看出當theta1=1的時候，代價函數值達到了最小值0，所以最終選擇theta1=1。

下面是簡單的練習題：

上面設theta0=0，簡單的對代價函數進行了分析，下面看下有兩個參數theta0、theta1的狀況：

圖中紅色的叉叉表明訓練數據，當只有參數theta1的時候，代價函數圖是二維的平面圖，可是當有兩個參數時，代價函數就是一個三維圖，以下所示：

從代價函數三維圖中能夠看出，位於曲平面最中間的點所在的座標（theta0，theta1）可使得代價函數值取得最小值，爲方便起見，把代價函數的三維圖換成等高線圖，即把曲平面映射到地面。以下所示：

代價函數等高線圖中，在相同顏色曲線上的點有相同大小的代價函數值，隨着參數theta0，theta1的調整，估計函數線逐漸與訓練數據重合，代價函數值逐漸變小，最終到達曲線平面的最中點。

三：梯度降低法

第二節中，咱們畫出代價函數關於參數theta0，theta1的圖形，從圖中能夠大概得知取得最小代價函數值時所對應的參數值，可是當參數個數多於2個的時候，這種方法就不適用了，所以本節研究自動獲取最佳參數的方法：梯度降低法。

梯度降低法是機器學習中經常使用的一種方法：

這裏梯度降低法的應用能夠想象成是：把代價函數圖當作是一座山，從山上任意一點出發下山，在給定步伐大小狀況下，須要在最快時間內走到山腳，也許不一樣的出發點可能到達不一樣的山腳，可是它們的海拔高度可能差很少。