http://www.cnblogs.com/wangxin37/p/8297988.htmlhtml
迴歸一詞指的是,咱們根據以前的數據預測出一個準確的輸出值,對於這個例子就是價格,迴歸=預測,同時,還有另外一種最多見的監督學習方式,叫作分類問題,當咱們想要預測離散的輸出值,例如,咱們正在尋找癌症腫瘤,並想要肯定腫瘤是良性的仍是惡性的,這就是0/1離散輸出的問題。更進一步來講,在監督學習中咱們有一個數據集,這個數據集被稱訓練集。算法
咱們將要用來描述這個迴歸問題的標記以下:函數
mm表明訓練集中實例的數量學習
x表明特徵/輸入變量atom
y表明目標變量/輸出變量spa
(x,y)表明訓練集中的實例3d
(x(i),y(i)) 表明第ii 個觀察實例xml
hh 表明學習算法的解決方案或函數也稱爲假設(hypothesis)htm
這就是一個監督學習算法的工做方式,咱們能夠看到這裏有咱們的訓練集裏房屋價格
咱們把它餵給咱們的學習算法,學習算法的工做了,而後輸出一個函數,一般表示爲小寫 h 表示。h 表明hypothesis(假設),h表示一個函數,輸入是房屋尺寸大小,就像你朋友想出售的房屋,所以 hh 根據輸入的 xx值來得出 yy 值,yy 值對應房子的價格 所以,hh 是一個從xx 到 yy的函數映射。blog
我將選擇最初的使用規則hh表明hypothesis,於是,要解決房價預測問題,咱們其實是要將訓練集「喂」給咱們的學習算法,進而學習獲得一個假設h,而後將咱們要預測的房屋的尺寸做爲輸入變量輸入給h,預測出該房屋的交易價格做爲輸出變量輸出爲結果。那麼,對於咱們的房價預測問題,咱們該如何表達 hh?
一種可能的表達方式爲:hθ(x)=θ0+θ1xhθ(x)=θ0+θ1x,(h(x)=k*x+b)由於只含有一個特徵/輸入變量,所以這樣的問題叫做單變量線性迴歸問題。