線性迴歸—求解介紹及迴歸擴展

時間 2019-11-12

原文原文鏈接

做爲機器學習中的線性迴歸，它是一個典型的迴歸問題，因爲容易理解、可解釋性強，被普遍應用於機器學習的過程當中。爲了深刻了解線性迴歸相關知識，飛馬網於4月12日晚邀請到前後在1號店、飛牛網等電商企業從事算法工做的張飛老師，在線上直播中，爲咱們分享線性迴歸知識。算法

如下本次是分享實錄：機器學習

一.迴歸的概念函數

迴歸在咱們的平常工做中常常會用到，好比預測銷量、房價等，咱們首先來了解一下什麼是迴歸？學習

二．變量之間的關係資源

兩個變量之間的關係是怎樣的呢？主要包括兩種關係：肯定性關係和非肯定性關係。肯定性關係能夠經過函數表達出來，例如圓點周長與半徑的關係、速度和時間與路程的關係、X與Y的函數關係等。非肯定性關係表示兩變量之間一種宏觀上的關係，不能精確用函數關係來表達，例如青少年身高與年齡的關係、身高與體重的關係、藥物濃度與反應率的關係。文檔

三．線性迴歸的概念直播

咱們下面來介紹線性迴歸的概念。當兩個變量存在準確、嚴格的直線關係時，能夠用Y=a+bX（X爲自變量，Y是因變量），表示二者的函數關係。電商

那爲何叫「迴歸」呢？這裏簡單瞭解一下。高爾頓在研究人的身高時，發現父代與子代的身高不是處於兩個極端，而是反映了一個規律，這兩種身高父親的兒子的身高，有向他們父輩的平均身高迴歸的趨勢，即當父親高於平均身高時，他們的兒子身高比他更高的機率要小於比他更矮的機率；父親矮於平均身高時，他們的兒子身高比他更矮的機率要小於比他更高的機率，這就是所謂的迴歸效應。變量

四．線性迴歸求解（迴歸參數的估計）原理

1.最小二乘法：

要求出a和b這兩個參數，就要用到最小二乘法的計算方法，咱們看下圖的迴歸方程。最小二乘法即保證各實測點到迴歸直線的縱向距離的平方和最小，並使計算出的迴歸方程最能表明實測數據所反映出的直線趨勢。

咱們簡單瞭解一下最小二乘法計算過程的例子：

函數模型寫成矩陣式以下圖。t1至tn爲輸入值，b0、b1作了一個矩陣乘法，y1到yn是實際的值。

根據下面這張圖中的戰艦數據，咱們求b1。

具體計算過程以下：

上面所講的最小二乘法均是在二元狀況下，咱們再看看多元狀況下的最小二乘法，也能夠用矩陣式表達，以下圖所示：

用矩陣轉置的運算方法來求解，會涉及矩陣逆的計算，就會有一個問題，若是數據量較大，計算就會很是慢，這是就要判斷擬合的好壞，那咱們用什麼指標來衡量呢？第一個方法是咱們計算出SE、SR、ST。

咱們也能夠經過另外的指標—相關係數來衡量擬合的好壞：

在多元線性迴歸時，數據量比較大的狀況下，最小二乘法求解耗費的資源較大，那咱們有沒有其它的方法呢？咱們來看下面這張圖：

2.梯度降低：