學習 Linear Regression in Python – Real Python,對 regression 一詞比較疑惑.html
這個 linear Regression 中的 Regression 是什麼意思,字面上 Regression 是衰退的意思,線性衰退?相信理解了這個詞,對線性迴歸可能印象深入些。python
搜了一番,原來是爲了記念生物統計學家高爾頓的發現,他是達爾文的表兄,一直想從進化論來研究爲什麼人各有不一樣。學習
他的一個重大發現是,父母的身高與子女的身高之間有某種關係。spa
平時生活中咱們也常常納悶,爲啥有的父母個子都很高,子女卻比較矮,相反,有的父母都很矮,孩子卻很高。高爾頓的解釋是,子代的平均身高向中心迴歸了。正是這種子代身高向同齡人平均身高迴歸的趨勢,使得人類身高沒有兩極分化。htm
因此他用「迴歸」這個詞來描述父輩身高 y 和子代身高 x 之間的關係。blog
還有一個有趣的解釋,是從詞源來解,regression 中:get
迴歸分析中的「迴歸」是什麼意思? - 我是觀察員的回答 - 知乎 這個答案用炒菜來比喻,頗有意思:博客
炒菜的體驗。假設你炒西紅柿雞蛋,要放鹽等調料才以爲好吃,你放了一小撮,不夠,再加點,結果多了;那就加點水,味道淡了。你感受有點太淡了,那就再加點鹽,直到你炒好了菜,你加鹽的過程才結束。 對你來講是美味吧?這就是迴歸的感受。it
意思就是,不斷的調整影響菜的口味的各類調料(鹽,水,等),直至找到一個均衡的比例。這個調整的過程當中有不斷的「回退」。io
至此終於理解 regression 的含義了。不過,統計學上的 y 與 x 之間的關係並不老是「迴歸」的含義。
研究變量之間的關係
變量是指什麼?關係是指什麼樣的關係?
先拿一個具體的線性迴歸的例子來講:
你想知道,爲啥同是 dev,某同事 A 比你年輕,工資卻比你高? 換句話說,影響大家工資的因素有哪些? 你想了想,A 雖然年輕,但比你來公司早一點,學歷比你高,會說話(可能剛來的時候談的工資就高?),等等。
對應上面的問題,這個例子中,
變量是什麼?
工資(y)
關係是指什麼樣的關係?
工資和年齡(x1)、工齡(x2)、學歷(x3)、性格(x4)等因素之間有什麼樣的關係
用統計學來表達,就是要找尋一個函-=數 y = f(x), where x: x1....xn.
這裏,y (工資) 是因變量,x1...xn(影響 y 的因素) 是自變量。
再舉一個例子:
某領導要求下屬去考察某市的房地產情況 房價(y)是他要作的考察之一 他要研究哪些因素(x1...xn)影響着該市的房價走向
還有不少其餘例子。
重點在於:線性迴歸研究這兩點:
本文由博客一文多發平臺 OpenWrite 發佈!
原文出處:https://www.cnblogs.com/learnbydoing/p/12151475.html