做者:xiaoyuphp
微信公衆號:Python數據科學python
知乎:python數據分析師git
學數據分析固然要先有數據,數據是分析的根本,否則一切都是空談。若是是在公司裏,獲得數據垂手可得,由於公司有客戶,有業務,必然會產生大量數據。但僅僅是我的學習的話,咱們如何獲得數據呢?github
其實這也是好多正在學習數據分析的朋友常會遇到一個問題。一些朋友可能說爬蟲能夠解決。沒錯,確實能夠經過爬蟲來獲取一部分信息,但也有侷限性,而且每次都爬不但麻煩,也會遇到不少問題,畢竟咱們的重點是分析而不是爬蟲。數據庫
下面博主將珍藏的一些網上公開數據源作一個彙總,幫助有須要數據的朋友們。微信
Kaggle是無數數據挖掘愛好者喜好的競賽平臺,它的大標語是:your home for data science
。許多大公司與Kaggle合做,提供公開的數據源,並設立獎金,但願數據挖掘愛好者們經過競賽的方式提供最優方案,解決實際問題。所提供的獎金豐厚,給予比賽最好成績的前三名選手。學習
固然,大部分人蔘加競賽並非爲了獎金而去,真實的目的是經過實戰來提升本身的數據挖掘能力,在與世界各國的愛好者進行切磋的同時,開闊本身的眼界和視野,學習新知識。而且,這些大公司提供的數據源是很是有參考價值的,能夠做爲實戰項目的首選,對求職者也是個很大的幫助。網站
https://tianchi.aliyun.com/spa
國內比較有名的數據挖掘平臺了,它是一個數據科學家的社區,由阿里巴巴組織。賽事衆多,有獎金支持,並雲集了各路國內愛好者和高校研究者的參加。比賽設有初賽,複賽,決賽等關卡,有評委進行把關。平臺一樣也擁有大量免費的數據集供愛好者們使用。
一樣也是數據科學的競賽平臺,報名後獲取任務數據集,也是一個很是好的學習網站。
雖然競賽人數和項目都通常,可是做爲數據科學社區,提供免費的數據集。並能夠在社區內進行技術交流和探討。
https://knoema.com/
https://data.worldbank.org.cn/
關於世界宏觀經濟的兩個網站,涵蓋大量相關數據和學習資源。
數據來源於中國國家統計局,主要涉及我國經濟民生等多個方面的數據,並在月度、季度、年度等多維度覆蓋,較爲全面和權威,對於社會科學的研究很是有幫助。
http://www.ceicdata.com/zh-hans
擁有超過128個國家的經濟數據,能夠很是精確地查找到各國GDP, CPI, 進口,出口,外資直接投資,零售,銷售,以及國際利率等數據。其中,「中國經濟數據庫」收編了300,000多條時間序列數據,數據內容涵蓋宏觀經濟數據、行業經濟數據和地區經濟數據。
萬得有「中國Bloomberg」的稱號,覆蓋了全面的金融業數據,且類目更新很是快,受到不少商業分析者和投資人的親睞。
擁有海量的統計資料,數量高達7,874本,同時涵蓋了1,761,009張統計表格和364,580,480個統計數據,聚集了中國資訊行自92年以來收集的全部統計和調查數據。
國家統計局官網,聚集了海量的全國各級政府各年度的國民經濟和社會發展統計信息,創建了以統計公報爲主,統計年鑑、階段發展數據、統計分析、經濟新聞、主要統計指標排行等爲輔助的多元化統計信息資料庫,目前在線資料已達上萬份。
一個研究成果共享的平臺,來自世界的研究成果分享,同時有共享的研究數據。
https://www.openstreetmap.org/
經過這個網站能夠下載世界各地的地圖數據。
一樣也是能夠提供地圖信息數據的網站;
https://github.com/caesar0301...
若是還嫌數據源不夠,github上有位大神已經爲你們整理好了一個很是全面的數據網站彙總,包含各個細分領域的數據資源(很是全),下面只是部分截圖。
其實數據是無處不在的,須要咱們平時善於發現和觀察。以上是本次向你們分享的免費數據網站,但願對你們能有所幫助。
關注微信公衆號:Python數據科學,發現更多精彩內容。