背景html
筆者從事於精算和數據分析工做多年,習慣於使用數據和模型來解決問題,加上駕駛運氣和技術稍差,十幾年內遭遇嚴重撞車事故四次,前後五次購買替換汽車,所以買車經驗也相對豐富。身邊常有朋友問起,買車到底要看哪些指標?某某萬左右的預算買什麼樣的車最划算?名牌車和進口車真的值得高價格嗎?算法
筆者在文中利用數據分析和建模技術,使用高端定量分析的方法,將可量化的價格、配置、品牌、產地、性能等方面進行理性分析,整理成客觀結論。筆者將忽略「駕駛感覺」、「品牌榮譽感」、「將來維修費用」等難以客觀量化的信息,而關注於量化信息的分析和概括,爲讀者提供參考。安全
正文網絡
買蔬果看顏色味道新鮮度、買衣服看款式質地品牌、買汽車應該看什麼?函數
雖然筆者有着豐富的購車經歷,但有一個問題一直想不明白:若是把汽車也看成一件普通的商品,到底哪些指標能做爲其「值不值錢」「划算不划算」的評判標準?爲了獲得這個標準,先要了解汽車這個大衆「商品」。本文選取並羅列了如下17個汽車的參數及其表明的含義。(在515汽車排行網中選取了截止至2015年5月的中國汽車銷量前200位的汽車,在汽車之家網站上查找了這些車型的價格及配置變量信息,在brandirectory.com網站上找到了汽車品牌評級、價值相關的信息)性能
變量測試 |
描述大數據 |
單位網站 |
價格spa |
不一樣車型標準配置對應的廠商推薦市場價格,價格單位是人民幣 |
元 |
車級 |
車型對應的車級,分爲A00,A0,A,B,C,D六級,根據德國標準劃分,主要依據軸距、排量、重量等參數,級數越高,汽車越豪華,如3萬元的奇瑞QQ爲A00,7萬的豐田威馳爲A0,10萬的大衆捷達爲A,24萬的別克君越爲B,40萬的奔馳E級爲C等。 |
級別 |
國家 |
車型的品牌所對應的國家,例如寶馬爲德國品牌、福特爲美國品牌、豐田爲日本品牌、長安爲國產品牌等。 |
國家 |
品牌評級[1] |
即品牌價值,由英國品牌顧問公司Brand Fiance發佈的2015年汽車品牌競爭力、實力的評級。由A,A+,AA-,AA,AA+,AAA-到AAA品牌實力逐步加強,如奔馳、寶馬爲AAA,豐田、大衆爲AAA-,本田、奧迪爲AA+,標緻、沃爾沃爲AA,雪鐵龍爲AA-,福田爲A+,俄羅斯的卡馬斯爲A-等。 |
級別 |
能源類型 |
汽車驅動使用的能源類型,例如汽油、油電混合、電動等 |
類型 |
發動機排量 |
是發動機各缸工做容積的總和,體現發動機性能指標,例如大衆捷達、寶馬3系的排量均爲1598ml,平時也表示爲1.6L; |
毫升 |
綜合油耗 |
工信部發布的車型在實際測試中所消耗的平均油量,例如大衆捷達的油耗爲6.6L/100Km,寶馬3系的油耗爲6.4L/100Km。 |
升/100公里 |
軸距 |
汽車前軸中心到後軸中心的距離,影響車的內部使用空間,例如大衆捷達的軸距爲2603mm,寶馬3系的軸距爲2920mm,比捷達車內空間更寬敞。 |
毫米 |
最大功率 |
功率越大,扭力越大,汽車的拉力也越強,經常使用最大功率來描述汽車的動力性能。如大衆捷達最大功率爲81Kw,寶馬3系的最大功率爲100Kw。 |
千瓦 |
變速器 |
分爲,手動(MT),自動(AT),手自一體(Tiptronic),CVT,雙離合(DCT) |
類型 |
安全氣囊數量[2] |
車內裝備的安全氣囊的數量,細分爲主/副駕駛座安全氣囊、前/後排安全氣囊及前/後排頭部氣囊三類,此處爲所有安全氣囊數的總和。例如大衆捷達的安全氣囊數量爲2,寶馬3系的安全氣囊數爲5。 |
個 |
其餘安全輔助 |
除安全氣囊外,汽車配備的常見的安全輔助裝備的數目,如膝部氣囊、胎壓監測裝置、零胎壓繼續行駛、安全帶未系提示、ISOFIX兒童座椅接口、發動機電子防盜、車內中控鎖、遙控鑰匙、無鑰匙啓動/進入系統。 |
個 |
電子穩定控制 |
ESC,一種輔助駕駛者控制車輛的主動安全技術,可以自動對車身的不穩定進行矯正,利於防止事故發生 |
有/無 |
其餘操控輔助 |
除電子穩定控制之外,汽車具備的其餘操控輔助配置的數目,如ABS防抱死、制動力分配(EBD/CBD等)、剎車輔助、牽引力控制、車身穩定控制、上坡輔助、自動駐車、陡坡緩降、可變懸架、空氣懸架、可變轉相比、中央差速器鎖止功能等。 |
個 |
定速巡航 |
司機不用踩油門踏板就可自動地保持車速,使車輛以固定的速度行駛,減輕駕駛員的疲勞 |
有/無 |
驅動類型 |
分爲前輪驅動、後輪驅動、智能四驅等 |
類型 |
Telematics |
經過無線網絡,將車輛接入互聯網,爲駕駛員提供駕駛行爲、路線指引等信息 |
有/無 |
其餘高科技[3] |
除Telematics之外,汽車所配備的其餘高科技裝置的數目,例如自動泊車入位、發動機啓停技術、併線輔助、車偏離預警西永、主動剎車/安全系統、夜視系統、中控液晶屏分屏顯示、全景攝像頭等。 |
個 |
表1
那麼這麼多的參數,哪些對於購車者而言是重要的、值得關注的,哪些又是可有可無的呢?經過蒐集百款汽車的參數與價格數據,通過數學建模與統計分析[4],筆者根據參數對汽車訂價的影響程度大小[5],且排序最靠前的4個參數:軸距、安全氣囊數(安全性能)、額定功率與品牌所屬的國家是最爲重要的。如圖1所示
通俗點說,只要這四個參數一經肯定,那麼一款汽車的價格大體就在一個相對固定的範圍內波動,不會有太大變化了。下面就來逐一進行解釋:
一樣的價位,哪款車更划算?
在大體瞭解了汽車基礎上,如筆者開篇所言,你們每每更關心的是:如何判斷一款汽車是否划算,購買汽車所耗費的金錢是否值得呢?
常常有朋友來諮詢筆者,提問的方式大體相同:「8萬如下的車是否是質量不夠好?」,"10萬左右什麼車比較好?」,「我打算花20萬買車,推薦幾款車型吧?」……其實你們的想法都同樣,就是在本身可接受的價格區間中,但願買輛知足本身須要的「好車」。可不一樣的人需求不一,實在難說什麼是「好」,筆者就以「不虧」爲目標進行分析。
筆者蒐集了2015年上半年我國汽車銷量排行由高到低的百款汽車的信息,通過統計分析[6]後,筆者發現銷售量最高的車輛售價在[8萬,13萬]之間,其次是[13萬,17萬],[5萬,8萬],[17萬,23萬],[23萬,30萬]以及[30萬,40萬]。所以,本文的第一部分將對比這六大類價格區間的汽車所具備的特徵。
首先,一塊兒來了解這六個價格區間上都有哪些暢銷的車型,如表3,
其次,經過蒐集上百款車型及其對應性能參數與價位,對這些數據進行統計分析,筆者整理了每個價格區間的汽車所應該具備的、與其市場價格對等的性能,如表4。換言之,能夠認爲表4中對應的汽車的參數範圍,是該價位所能買到的較爲合理的配置。
然而,若每當肯定了心理價位便找來此表一一對比這些參數是否在合理的區間上難免過於麻煩,筆者在想,是否有一個指標,其的數值大小即可以代替「划算程度」的高低,所以,筆者構建了隨機森林方法下的汽車價格預測模型[8],並引入了一個評估汽車訂價是否合理的標準——划算指數[9],
划算指數越大,划算度越高,代表該款車型其價格與性能匹配程度越高,即人們常說的「越划算」。某一車系的划算指數,即全部該車系汽車划算指數的均值。
其中,划算因子即根據模型得出的預測價格與市場價格的相對差值,
因子乘數的目的在於標準化划算指數,將百分比表示的,包含正負的划算因子轉化爲更直觀的,僅以整數存在標準化度量,可表示爲:
表5~10將分別展現六個價格區間中每一款車型的划算指數排序[13],僅供讀者參考
類似的性能,不一樣車系的差異是什麼?
一部分人購車的款型是由預算決定的,也有一些人對不一樣系別的汽車有着格外的偏心。
2014年,中國汽車年銷量突破2300萬輛。這已是我國保持世界第一銷量記錄的第六個年頭。對於中國這個巨大的汽車需求市場,各個國家的廠商的銷量都逐年上升。2015年截至9月,我國乘用車系別的銷量佔比彙總如圖2,
由圖2可知,今年我國自主品牌的銷量領先於進口品牌,穩居最大的市場份額。同時,進口車中主流的德系、日系、美系和韓系汽車在我國汽車市場也保持着相對穩定的市場份額。
必須得認可,經歷了跌落與回升,我國汽車市場上許多自主品牌已經崛起。這麼高的銷量真的是由於國產廠商愈來愈被承認的研發實力嗎?其實否則,根據汽車行業研究公司威爾森監測的數據顯示,從2009-2015年的價格段份額變化窺探出自主品牌的增加主要是來自於低端市場,主要集中在5萬元如下的產品,並且越是低端的市場,增加的貢獻越大。
再者,從車型壽命上來看,國產品牌的車卻顯得後勁不足。從近五年的數據來看,2010年自主品牌在售的車型有181種,這些車型到了2015年僅剩下116種,有65種消失了,平均每一年消失8%;而合資品牌大概每一年僅3.7%的車型消失,詳見圖3,
基於此,能夠認爲國產汽車主要佔據着我國低端價位的汽車市場。那中等、中上價格的汽車也會呈現相似的規律——由某一種或幾種車系主導嗎?不一樣車系的汽車之間有何差別,對於購車者有什麼影響,下文繼續探討。
筆者就以在我國汽車市場上主流的六大車系爲研究對象,根據上文提到的主要影響汽車訂價的四個因素,進行對比,如表11,
首先,觀察不一樣國家汽車的性能,在安全性方面,德國品牌的汽車以高安全性能優於其餘國家品牌的汽車。亞洲汽車的安全性能廣泛弱於美洲、歐洲品牌的汽車——即中、日、韓品牌的汽車所具備的安全氣囊數量遠小於以德國爲表明的歐洲、美國品牌汽車具備的安全氣囊數。
其次,將功率與油耗放在一塊兒進行分析。按照常理:功率越大,行駛一樣的距離會更耗油,就像美國、其餘歐洲國家品牌的汽車所呈現出的「大功率-大油耗」同樣。然而,有別於美國或其餘歐洲國家的汽車,德國品牌的汽車卻能同時擁有較高的功率,以及單位千米相對較低的耗油量。側面反映了德國廠商在此領域投入的高額研發成本以及取得的成績,體現了德國汽車在此領域領先的技術水平。
此外,筆者收集並統計整理了汽車銷量排行榜的數據,發現中國人花了更多的錢去購買德國車。分析結果顯示,中國人購買的昂貴的汽車品牌幾乎都歸屬於德國,其次是美國、日本。國人更願意爲進口的品牌出高價,是由於人們的羣聚效應[14]仍是另有其餘緣由呢?筆者一直相信,這看似感性的行爲實際上是能夠被科學的解釋的。
所以,筆者便對四大車系[15]表明車型的划算指數波動幅度進行了分析。每一車系划算指數波動幅度越小,代表該系列汽車的價格越穩定,汽車性能的參數波動幅度越小,即性能越好,越值得被購買。它在某種程度上說明了此係列汽車不會平白無故虛高擡價,也更不容易出現大幅降價的現象。爲了更直觀地向讀者進行展現,本文將這種變化程度按照統一標準變形爲[0,10]的正數值[16],如表12
很明顯,基於對划算指數波動程度的分析,以德國車爲表明的歐洲汽車對於購買者而言其價格最穩定。其次是美國車、日韓車,最後是中國品牌的汽車。這與汽車市場上人們實際的購買行爲相契合,解釋了市場上最暢銷的中高價位汽車主要集中於德國、美國品牌,低價位汽車卻大都是國產品牌的現象。
相同的車系與市場定位,哪一個品牌更有價值?——以寶馬、奧迪和奔馳三個品牌爲例說明
其實還有一部分購車者,每每都會將可選擇的品牌範圍縮小至三個左右,這三個品牌的汽車在性能上高度類似,價格上差異也不大。面對這樣的狀況,如何能選擇到「更划算、更有價值」的品牌呢?
在此,筆者僅以最爲暢銷的德國品牌寶馬、奔馳和奧迪爲例,根據其划算指數和其波動幅度的大小,比較這三個類似度較高的品牌。
表13爲三個品牌暢銷車型的部分擬合結果顯示,每一種品牌後都標明瞭該品牌(以暢銷車型爲表明)的划算指數
分別觀察這三款品牌的划算指數(表14)及其波動幅度(表15)
顯然,在寶馬、奔馳和奧迪這三款定位類似德國品牌中,寶馬系列對於購車者而言是最划算的,即對於購車者而言是最有價值的。這與筆者在Brandirectory.com中查到的品牌評級[18]結果較爲一致,即寶馬爲AAA,奔馳爲AAA-,奧迪則是AA+。即寶馬獲得了最高的品牌評級,其基於隨機森林得出的划算程度最高,市場價格也最穩定。
相似的結果能夠從其餘類似定位的品牌中發現:菲亞特、雪鐵龍、標緻、斯柯達這四款歐系車型中菲亞特的綜合價值更高;豐田、日產尼桑和本田三款屬於日本車型中,豐田的價值最高。
此外,筆者發現,在品牌評級相同的狀況下(如日產和本田),其平均車級越低,對應的划算指數也越低。但以上規律在國產車的訂價中並非那麼的有效,緣由在於品牌評級出自於國外的研究結果,國內汽車品牌在國際上的影響力和在國內的影響力並不一致。
結束語
目前,人們對於大數據改變生活這一律念已經沒有懷疑,而真正的焦點則應該放在如何利用大數據來實現更多美好生活的願景上。人們愈來愈習慣依賴「爆炸式」的信息作選擇,然而這樣「無篩選」的信息卻每每提供不多的價值。汽車愈來愈成爲必不可少的代步機器,更須要保障人們的安全,本文首先但願告訴讀者應該重點關注汽車的哪幾個性能參數,如軸距、安全氣囊數、最大功率和國家(產地),讓挑選汽車這一行爲「可量化」。
其次,爲了儘量提升購車者的「滿意度」——即所購汽車品質高於或等同於其市場價格,筆者引入了「划算指數」,其數值越大,代表該款車型的性能價值越接近或高於其市場價格,對購車者越划算;同時,划算指數的波動幅度也向讀者展現了汽車價格的穩定程度,側面顯示了某款車型的訂價標準更爲穩定與合理,更值得被信任。
最後,本文的全部比較主要基於汽車性能參數對價格的影響,很難融入個性化的駕駛體驗、品牌忠誠度等因素。筆者不敢保證本文的絕對權威性,由於每每一句「我喜歡」就能夠推翻全部的所謂「理性」。但筆者相信更多的購車者仍然會按需篩選、擇優購車,先看現實、再談理想。現在是「大數據的時代」,更是「用數據的時代」,謹以此文爲讀者們帶去些許幫助。
做者介紹
趙昕,女,德勤中國精算和保險諮詢部門副總監,財產精算師,美國精算協會會員,美國註冊覈保師,金融風險管理師,美國威斯康星大學數學碩士,南開大學計算數學學士;
毛耀鋆,男,德勤上海精算及保險諮詢團隊分析師,上海財經大學金融保險統計學士;
羅韡,女,德勤上海精算及保險諮詢團隊分析師,上海財經大學保險精算碩士與學士。
潘紅豆,女,德勤上海高級定量分析團隊實習生,上海財經大學在讀;
伍哲豪,男,德勤上海高級定量分析團隊實習生,上海交通大學在讀。
參考文獻
1、網站
[1]2015年上半年汽車銷量排行榜
http://xian.auto.ifeng.com/xinwen/2015/0731/7816.shtml
[2]2014中國汽車產銷數據一覽:車企/車型前十排名及份額佔比
http://www.wtoutiao.com/a/1282899.html
[3]2014中國車市回顧:德系品牌依然強
http://shuoke.autohome.com.cn/article/19610.html
[4]汽車銷量速報 中國 2015年
http://www.marklines.com/cn/statistics/flash_sales/salesfig_china_2015
[5]汽車點評 排行榜
http://product.xgo.com.cn/top/xl_all.html
[6]品牌評級變量
http://brandirectory.com/league_tables/table/auto-2015
2、論文
[1] 葛春梅.中國汽車產品訂價研究 吉林大學,2008
[1]品牌評級來源:http://brandirec,tory.com/league_tables/table/auto-2015 在這裏爲了在線性迴歸過程當中便於解釋分析,咱們將評級後所帶的「+/-」符號去掉,改成劃分A、AA、AAA三個等級。
[2]安全氣囊數量、其餘安全輔助及其餘操控輔助的分類規則:搜索個數在數據集中出現的頻數,觀察頻數分佈,將頻數分佈最爲密集的區間設爲中級,小於這一區間設爲低級,高於這一區間設爲高級。
[3]其餘高科技這一變量因爲區間爲0-2,且數目爲0的車高達170輛,所以咱們將這一變量在模型中改成有無這一分類方法。
[4]研究選擇了經常使用的五種迴歸樹模型對汽車訂價進行預測,並將數據隨機分紅兩個部分,一部分用於構建模型(訓練數據),另外一部分用於驗證所構建模型在預測價格方面的效果,筆者但願經過對比預測效果選擇合適的模型用於對車價進行預測,評判標準是預測價格與實際價格越接近,模型的預測效果越好。
五種迴歸模型以下:
迴歸樹:首先考慮對比全部對車價影響的因素,根據必定篩選規則(通常是分類以後整體預測偏差最小)選出最重要的分類因素,以此類推。因爲這種二分法的過程經過圖形表現出來很像帶有分叉的樹,咱們將其稱爲樹迴歸。在樹的末端,模型會給出符合不一樣分類的車的價格的判斷。迴歸樹分爲Gini和Information是兩種不一樣的變量篩選方法,其目的是選擇最優的分叉數以及結點的變量。
隨機森林:是由許多的決策樹組成,由於這些決策樹採用了隨機方法,所以也叫隨機決策樹。隨機森林中的樹之間是沒有關聯的。當測試數據進入隨機森林時,其實就是讓每一棵決策樹對其進行迴歸,最後取回歸結果的均值,即爲模型預測價格。
Boosting:是一種用來提升弱分類算法(如:單層決策樹,即只有一個結點的決策樹)準確度的方法,而後以必定的方式將他們組合成一個預測函數。主要是經過對樣本集的操做得到樣本子集,而後用弱分類算法在樣本子集上訓練生成一系列的基分類器。
Lasso:是一個基於線性迴歸模型基礎上改進的模型,爲了提升模型對樣本外數據的估計準確度,Lasso利用篩選重要變量的方法將模型中重要的自變量留下,減小模型因無關自變量過多帶來的問題(多重共線性,變量數大於樣本數等)。
Ridge:是基於線性迴歸模型基礎上改進的模型,爲了避免減小模型中的自變量同時須要提升模型對樣本外數據估計的準確性,Ridge方法經過在原有的線性模型的基礎上加上一懲罰項(Penalty)變成有偏估計來減少因爲變量過多帶來的方差過大。
[5]即變量在迴歸模型中的重要程度排序
[6]彙總了2015年上半年在我國最暢銷的200款汽車其車型參數、性能參數、價格等信息後,將其按照所選價格區間進行了六大分類,如表3。並根據百分比分析,將各個價格區間的銷量總和佔總銷量的半分比進行了排序,獲得了表3最後一列所示的暢銷度(半年銷量)。接下來,在每一類價格區間中,筆者根據相關性(數據密集度)分析,在去除極端值後,計算相應參數所處的區間、均值(指望值),彙總於表3。以方便讀者根據本身想要購買汽車的預算,對應參數指望所處的區間,再與想買的汽車的參數進行比較。
[7]油耗:汽車在良好路面上做等速行駛時的耗油量。
[8]因爲「駕駛體驗」、「品牌忠誠度」、「市場導向性」等影響因素難以量化,本文便以可量化的汽車的各個參數爲研究對象,經過分析這些參數與汽車訂價的相關性,來評定其是否「划算」,詳見附錄。
[9]划算指數是划算因子的正數表示,其值越大,代表此款汽車的訂價高於與其性能所匹配的市場價格,划算程度越低,反之。換言之,划算指數即表示某一款車型與市場上其餘性能類似車型的價格相對差值,越大越不划算。
[10]划算因子便是指與基於預測模型上的,汽車預測價格與實際價格的差值相對預測價格的比值,即相對差值,以免因爲價格差別形成的影響。
[11]預測價格是基於筆者利用隨機森林方法構建的汽車訂價模型計算出的汽車價格,其原理爲經過限定汽車主要性能的參數取值,經過迴歸擬合對汽車的價格進行模擬預測。有興趣的讀者可詳細閱讀附錄或聯繫筆者。
[12]在本文的研究樣本中,最大划算因子爲15.84%,對應10分的划算指數;最小划算因子爲-12.96%,對應0分的划算指數。
[13]此排序及後面的排序均以划算指數爲比較標準,在可得到汽車性能參數的基礎上,使其性能儘量同質化,而後再比較其價格與基於隨機森林訂價模型計算得出的預測價格之間的相對差值。其餘關於汽車排序當基於不一樣的比較標準與方法,所以敬請廣大讀者理解不一樣排名間的差別,僅供參考。
[14]羣聚效應(Critical mass)是一個社會動力學的名詞,用來描述在一個社會系統裏,某件事情的存在已達至一個足夠的動量,使它可以自我維持,併爲日後的成長提供動力。以一個大城市做一個簡單例子:如有一我的停下來擡頭往天望,沒有人會理會他,其餘路過的人會照舊繼續他們要作的事情。若是有三我的停了下來擡頭望天,可能會有多幾我的會停下來看看他們在作什麼,但很快又會去繼續他們原來的事。但倘若當街上擡頭向天望的羣衆增長至5到7人,這時,其餘人可能亦會好奇地加入,看看他們到底在作什麼。
[15]在此,考慮到樣本量需求,提升分析結果的可信度,將德國車歸入歐洲車系列,並將日本與韓國兩大車系合併。
[16]划算指數波動幅度由模型預測價格與市場價格迴歸擬合的方差來衡量,爲了直觀地表示,方差越大,擬合程度越好,波動幅度越小。爲直觀表示,筆者將波動幅度轉化爲0到10之間的正數值,即波動幅度=0+(1-方差)*乘數因子;其中乘數因子數值大小爲100,計算方式爲:10/(方差的上限值1-方差下限值0)
[17]因爲樣本量有限,計算出寶馬與奔馳兩個品牌划算指數的波動幅度較小,轉爲爲正數值後均小於0.01,所以在這裏近似於0。
[18]同前文,品牌評級是由英國品牌顧問公司Brand Fiance發佈的2015年汽車品牌競爭力、實力的評級,即表明品牌價值。由A,A+,AA-,AA,AA+,AAA-到AAA品牌實力逐步加強。