數據的獲取方式:html
一、獲取外部的公開數據集,python
UCI 加州大學歐文分校開放的經典數據集,被不少數據挖掘實驗室採用 http://archive.ics.uci.edu/ml/datasets.html網頁爬蟲
國家數據:數據來源於中國國家統計局,包含了我國經濟民生等多個方面的數據。 http://data.stats.gov.cn/scrapy
CEIC:超過128個國家的經濟數據,能精確查找GDP、進出口零售,銷售等深度數據。 http://www.ceicdata.com/zh-hans函數
中國統計信息網:國家統計局官方網站,聚集了國民經濟和社會發展統計信息。 http://www.tjcn.org/網站
優易數據:由國家信息中心發起,國內領先的數據交易平臺,不少免費數據。 http://www.youedata.com/url
二、爬蟲spa
要求:htm
python基礎知識 元素(列表、字典、元組等)、變量、循環、函數………ci
Python 庫(urllib、BeautifulSoup、requests、scrapy)實現網頁爬蟲
網站:電商網站、問答網站、二手交易網站、婚戀網站、招聘網站等
三、待續