在大城市租房成爲了每個來這座城市打拼的年輕人不可避免的一個環節。 而手頭相對並不寬裕的他們,房租便是他們每個月工資開銷的大頭,在心儀的地段找到一個性價比相對較高的落腳地,幫助他們節約開銷。算法
這篇報告大體分析了紐約市房租、戶型、地理位置等情況。但願經過這些既有數據能對房租有一個大體的判斷,從而幫助咱們找到「最合適」的出租房。樣本數據來源爲RentHop租房網站。網站
首先,戶型是每一個租房客都很關心的問題。spa
可見,一衛的房型是最爲廣泛的,其數量要遠遠超過其餘類型的房子。3d
而在臥室方面,一居以及兩居室的小戶型則最爲常見。blog
從戶型總體狀況來看:一室一衛和兩室一衛的戶型最廣泛。ci
其次,房子的地理位置也是租房客們很關心的一個要素。數學
咱們根據房租的地理位置而不是行政劃分來大體地看一下紐約地區房屋地理分類,在這裏咱們使用了Kmeans算法來進行聚類。table
以下所示,這時紐約市房屋出租的所有信息。基礎
咱們由簡單到複雜,在地理位置上對這些地點進行數學上的分類。方法
若是咱們簡單進行3分切割的時候:
若是咱們進行10分切割的時候:
咱們能夠任意地根據房屋的密度對整個市區進行地理上的劃分,也能夠根據我的的須要對區塊大小和數量進行調整。但願這樣的劃分能夠打破行政區域的固定思惟,在下一節加入價格這個重要維度的時候儘量地幫助咱們作出正確的決策。
再次,咱們將要討論房屋的配套。
這是最爲常見的20種房屋配套:
最後,咱們要看一下房屋租金的狀況。
房租受多種因素影響,包括戶型,地理位置,房屋配套等等因素。下面,咱們就來逐個分析以上因素對價格的影響。
1. 戶型和價格
因爲房租經常是以整套房子的形式掛在網上的,因此天然臥室的數量越大,整個房租的檔位也就越高。可是爲了驗證這個假設,咱們必需要看一下房租的價格是否是會隨着臥室數量的增高而增高。
通過計算,不管是隻計算臥室數量仍是臥室和衛生間數量加總在一塊兒進行計算,其和價格的相關性都很小。
|
Bedrooms |
Totalrooms |
Price |
Bedrooms |
1.000000 |
0.936217 |
0.059485 |
Totalrooms |
0.936217 |
1.000000 |
0.081037 |
Price |
0.059485 |
0.081037 |
1.000000 |
*Totalrooms=Bedrooms + Bathrooms
因而可知,咱們根據臥室(或者臥室加衛生間的總數)對價格進行標準化修正是沒有問題的。這裏以平均每間臥室的單價進行分析,單個房間的價位廣泛在1000到3000左右不等。
2. 地理位置和價格
咱們能夠繼續使用聚類的分析方法,在經緯度的基礎上,加上價格的維度,會使以前的分佈圖更加直觀有效:
在加入價格這個維度以後,咱們把分類的層級提升到了20層,旨在增長更多的選擇空間。圖中相同顏色的房屋能夠做爲僅考慮地理位置和房租水平的同級別選擇。