在監督學習中咱們有一個數據集,這個數據集被稱訓練集。算法
𝑚 表明訓練集中實例的數量函數
𝑥 表明特徵/輸入變量學習
𝑦 表明目標變量/輸出變量
(𝑥, 𝑦) 表明訓練集中的實例
(𝑥(𝑖), 𝑦(𝑖)) 表明第𝑖 個觀察實例spa
ℎ 表明學習算法的解決方案或函數也稱爲假設(hypothesis)class
這就是一個監督學習算法的工做方式,能夠看到這裏有咱們的訓練集裏房屋價格
咱們把它餵給咱們的學習算法,學習算法的工做了,而後輸出一個函數,一般表示爲小寫 ℎ
表示。ℎ 表明hypothesis(假設),ℎ表示一個函數,輸入是房屋尺寸大小,就像你朋友想出售
的房屋,所以 ℎ 根據輸入的 𝑥值來得出 𝑦 值,𝑦 值對應房子的價格 所以,ℎ 是一個從𝑥
到 𝑦 的函數映射。
我將選擇最初的使用規則ℎ表明hypothesis,於是,要解決房價預測問題,咱們實際上
是要將訓練集「喂」給咱們的學習算法,進而學習獲得一個假設ℎ,而後將咱們要預測的房屋
的尺寸做爲輸入變量輸入給ℎ,預測出該房屋的交易價格做爲輸出變量輸出爲結果。那麼,
對於咱們的房價預測問題,咱們該如何表達 ℎ?
一種可能的表達方式爲:ℎ𝜃(𝑥) = 𝜃0 + 𝜃1𝑥,由於只含有一個特徵/輸入變量,所以這樣
的問題叫做單變量線性迴歸問題。變量