[斯坦福大學2014機器學習教程筆記]第四章-多元線性迴歸的多特徵量狀況下的假設形式

    在這節中,咱們將開始討論一種新的線性迴歸的版本。這是一種更爲有效的形式,這種形式適用於多個變量或者多特徵量的狀況。學習

    在咱們以前的學習中,咱們只有一個單一特徵變量x(以下面例子中的房屋面積),咱們但願用這個特徵量來預測y(以下面例子中的房屋價格)。咱們的假設就爲hθ(x)=θ01x。spa

    可是,咱們在不少時候咱們不只有房屋面積這一個特徵來預測房屋價格,咱們還會有臥室的數量、樓層的數量和房子的年齡多個特徵來預測房屋價格。blog

    咱們用變量x1、x2、x3、x4來表示這裏的四個特徵,用y來表示預測的輸出變量。索引

  • 咱們用n來表示特徵量的數目,如這裏的n=4。
  • 咱們用m來表示樣本的數量
  • 咱們用x(i)表示第i個訓練樣本的輸入特徵量。舉個例子,這個例子中x(2)表示第2個訓練樣本的特徵向量,因此x(2)表示的就是向量[1416,3,2,40](列向量)。在這個表示方法中,2至關於一個訓練集的一個索引。
  • 咱們用xj(i)來表示第i個訓練樣本中第j個特徵量的值。這個例子中x3(2)表示第2個訓練樣本的特徵向量裏面的第3個特徵值,因此它的值爲2。

    既然咱們有了多個特徵量,那咱們的假設形式應該寫成什麼樣呢?變量

  • 咱們以前的假設形式爲:hθ(x)=θ01x。
  • 如今咱們的假設形式爲:hθ(x)=θ01x12x23x34x4。假如咱們有n個特徵量,那麼假設形式就爲:hθ(x)=θ01x12x23x3+……+θnxn

    接下來,咱們要簡化上面寫出的表達方式。爲了分別咱們設x0=1(這意味着對於第i個樣本都有x0(i)=1)。固然你也能夠認爲咱們定義了一個額外的第0個特徵量。在此以前咱們有n個特徵量(x1,x2,……xn),因爲咱們另外定義了一個第0特徵量,而且取值恆爲1,因此如今有n+1個特徵量。因此咱們如今的特徵向量X=[x0,x1,x2,……xn](列向量),這是一個n+1維的向量。同時咱們還能夠把全部的參數寫成一個向量,θ=[θ0,θ1,θ2,……θn](列向量),這也是一個n+1維的向量。方法

  •     這時咱們的假設形式能夠寫成:hθ(x)=θ0x01x12x23x3+……+θnxn

     更巧妙的是,咱們能夠將這個式子寫成θTX(θ的轉置乘以X)im

相關文章
相關標籤/搜索