去年年末,博主有購房的意願,原本是打算在青島市北購房,怎奈工做變更,意向轉移到了李滄,坐等了半年之後,最終選擇在紅島附近購置了期房。html
也許一些知道青島紅島的小夥伴會問我,爲何會跑到那鳥不拉屎的地方去買房子,目前只能是一個字:"賭、賭、賭",重要的事情說三遍。下面來分析一下,我爲何沒有在李滄買。mysql
爬取了2018年1月份到2019年3月底李滄二手房成交記錄,數據僅限於鏈家,不表明李滄地區的所有數據,可是我以爲應該對你們有必定的參考意義。git
建立基本的數據庫:sql
CREATE TABLE `house` ( `id` int(10) unsigned NOT NULL AUTO_INCREMENT COMMENT '主鍵', `url` varchar(50) NOT NULL COMMENT '網絡訪問地址', `listed_price` double NOT NULL COMMENT '掛牌價格', `completion_date` date NOT NULL COMMENT '成交日期', `transaction_cycle` int(11) NOT NULL COMMENT '成交週期', `modify_price` int(11) NOT NULL COMMENT '調價次數', `square_metre` double NOT NULL COMMENT '建築面積', `unit_price` double NOT NULL COMMENT '單價', `total_price` double NOT NULL COMMENT '總價', `age_completion` int(11) NOT NULL COMMENT '建成年代', `community_name` varchar(50) NOT NULL COMMENT '所在小區', PRIMARY KEY (`id`) ) ENGINE=InnoDB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8
爬取代碼:chrome
__author__ = "小柒" __blog__ = "https://blog.52itstyle.vip/" import requests import time # 導入文件操做庫 import os import re import bs4 from bs4 import BeautifulSoup import sys from util.mysql_DBUtils import mysql # 寫入數據庫 def write_db(param): try: sql = "insert into house (url,listed_price,transaction_cycle,modify_price," \ "square_metre,unit_price,total_price,age_completion,community_name,completion_date) " sql = sql + "VALUES(%(url)s,%(listed_price)s, %(transaction_cycle)s,%(modify_price)s," sql = sql + "%(square_metre)s,%(unit_price)s,%(total_price)s," \ "%(age_completion)s,%(community_name)s,%(completion_date)s)" mysql.insert(sql, param) except Exception as e: print(e) # 主方法 def main(): # 給請求指定一個請求頭來模擬chrome瀏覽器 headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 ' '(KHTML, like Gecko) Chrome/54.0.2840.99 Safari/537.36'} page_max = 24 # 爬取地址 for i in range(1, int(page_max) + 1): print("第幾頁:" + str(i)) if i == 1: house = 'https://qd.lianjia.com/chengjiao/licang/' else: house = 'https://qd.lianjia.com/chengjiao/licang/pg'+str(i) res = requests.get(house, headers=headers) soup = BeautifulSoup(res.text, 'html.parser') li_max = soup.find('ul', class_='listContent').find_all('li') for li in li_max: try: house_param = {} # 所在小區 community = li.find('div', class_='title').text community_name = community.split(" ")[0] house_param['community_name'] = community_name # 成交地址 title_src = li.find('a').attrs['href'] house_param['url'] = title_src res = requests.get(title_src, headers=headers) soup = BeautifulSoup(res.text, 'html.parser') # --------------------------------------------------------# # 成交日期 completion_date = soup.find('div', class_='house-title').find('span').text completion_date = completion_date.split(" ")[0] completion_date = completion_date.replace(".", "-") house_param['completion_date'] = completion_date # 掛牌價格 listed_price = soup.find('div', class_='msg').find_all('span')[0].find('label').text house_param['listed_price'] = listed_price # 成交週期 transaction_cycle = soup.find('div', class_='msg').find_all('span')[1].find('label').text house_param['transaction_cycle'] = transaction_cycle # 調價次數 modify_price = soup.find('div', class_='msg').find_all('span')[2].find('label').text house_param['modify_price'] = modify_price # 建築面積 square_metre = soup.find('div', class_='content').find("ul").find_all('li')[2].text square_metre = re.findall(r'-?\d+\.?\d*e?-?\d*?', square_metre)[0] house_param['square_metre'] = square_metre # 總價 total_price = soup.find('span', class_='dealTotalPrice').find('i').text house_param['total_price'] = total_price # 單價 unit_price = soup.find('b').text house_param['unit_price'] = unit_price # 建築年代 age_completion = soup.find('div', class_='content').find("ul").find_all('li')[7].text age_completion = re.findall(r'-?\d+\.?\d*e?-?\d*?', age_completion)[0] house_param['age_completion'] = age_completion write_db(house_param) except Exception as e: print(e) mysql.end("commit") mysql.dispose() if __name__ == '__main__': main()
經過數據爬取,一共找到了706套二手成交房。數據庫
直奔主題,數據分析下,你們比較關心的價格問題,如下是2019年1月-3月的二手房成交量以及成交價格:瀏覽器
位置 | 成交量 | 單價 |
---|---|---|
李滄 | 124 | 21100 |
同比去年的二手房成交量以及成交價格:網絡
位置 | 成交量 | 單價 |
---|---|---|
李滄 | 277 | 21306 |
嚇的博主趕忙用計算器認認真真,仔仔細細的核算了三遍,纔敢寫下這幾個數字,同比去年,單價整整降了206人民幣,此處有掌聲。再看一下成交量,相比去年少了足足一半之多,相信那124套房子也是賣家忍痛降了206人民幣才賣出去的吧!url
好了,再看一下你們比較關心的成交週期,2019年1月-3月的二手房成交量以及成交週期:spa
位置 | 成交量 | 成交週期(天) |
---|---|---|
李滄 | 124 | 96 |
同比去年的二手房成交量以及成交週期:
位置 | 成交量 | 成交週期(天) |
---|---|---|
李滄 | 277 | 83 |
不得不說,相比去年房子的確是難賣了。
不少同事,同窗,1三、14年就已經上車了,那時李滄1w不到,再看看如今?不想看,沒眼看,不能看。最終沒在李滄買房,也不是買不起,只是看不到降的但願,相對壓力又大一些,並且,也不想把家庭全部的積蓄都賭在這裏。
最後,對於剛需就是一個建議,能買早買,有房和沒房看一個城市是不同的,努力賺錢的最大意義就是提高你的幸福感。活在人間不吃煙火食?真覺得本身是神仙?有些東西一說的實際一點真的是會傷到某些人的心,祝大家用鍵盤打敗一切。