還在爲找數據而發愁嗎?看完這篇應該不再會了

做者:xiaoyuphp

微信公衆號:Python數據科學python

知乎:python數據分析師git


學數據分析固然要先有數據,數據是分析的根本,否則一切都是空談。若是是在公司裏,獲得數據垂手可得,由於公司有客戶,有業務,必然會產生大量數據。但僅僅是我的學習的話,咱們如何獲得數據呢?github

其實這也是好多正在學習數據分析的朋友常會遇到一個問題。一些朋友可能說爬蟲能夠解決。沒錯,確實能夠經過爬蟲來獲取一部分信息,但也有侷限性,而且每次都爬不但麻煩,也會遇到不少問題,畢竟咱們的重點是分析而不是爬蟲。數據庫

下面博主將珍藏的一些網上公開數據源作一個彙總,幫助有須要數據的朋友們。微信

1 機器學習/數據挖掘

1. 1 Kaggle

https://www.kaggle.com/機器學習

Kaggle是無數數據挖掘愛好者喜好的競賽平臺,它的大標語是:your home for data science。許多大公司與Kaggle合做,提供公開的數據源,並設立獎金,但願數據挖掘愛好者們經過競賽的方式提供最優方案,解決實際問題。所提供的獎金豐厚,給予比賽最好成績的前三名選手。學習

固然,大部分人蔘加競賽並非爲了獎金而去,真實的目的是經過實戰來提升本身的數據挖掘能力,在與世界各國的愛好者進行切磋的同時,開闊本身的眼界和視野,學習新知識。而且,這些大公司提供的數據源是很是有參考價值的,能夠做爲實戰項目的首選,對求職者也是個很大的幫助。網站

1.2 天池

https://tianchi.aliyun.com/spa

國內比較有名的數據挖掘平臺了,它是一個數據科學家的社區,由阿里巴巴組織。賽事衆多,有獎金支持,並雲集了各路國內愛好者和高校研究者的參加。比賽設有初賽,複賽,決賽等關卡,有評委進行把關。平臺一樣也擁有大量免費的數據集供愛好者們使用。

1.3 數據城堡(DataCastle)

http://www.pkbigdata.com/

一樣也是數據科學的競賽平臺,報名後獲取任務數據集,也是一個很是好的學習網站。

1.4 SofaSofa

http://sofasofa.io/index.php

雖然競賽人數和項目都通常,可是做爲數據科學社區,提供免費的數據集。並能夠在社區內進行技術交流和探討。

2各行業的數據網站

2.1 世界宏觀經濟數據

https://knoema.com/
https://data.worldbank.org.cn/

關於世界宏觀經濟的兩個網站,涵蓋大量相關數據和學習資源。

2.2 國家統計局

https://www.stats.gov.cn/

數據來源於中國國家統計局,主要涉及我國經濟民生等多個方面的數據,並在月度、季度、年度等多維度覆蓋,較爲全面和權威,對於社會科學的研究很是有幫助。

2.3 CEIC

http://www.ceicdata.com/zh-hans

擁有超過128個國家的經濟數據,能夠很是精確地查找到各國GDP, CPI, 進口,出口,外資直接投資,零售,銷售,以及國際利率等數據。其中,「中國經濟數據庫」收編了300,000多條時間序列數據,數據內容涵蓋宏觀經濟數據、行業經濟數據和地區經濟數據。

2.4 萬得(Wind)

http://www.wind.com.cn/

萬得有「中國Bloomberg」的稱號,覆蓋了全面的金融業數據,且類目更新很是快,受到不少商業分析者和投資人的親睞。

2.5 搜數網

http://www.soshoo.com/

擁有海量的統計資料,數量高達7,874本,同時涵蓋了1,761,009張統計表格和364,580,480個統計數據,聚集了中國資訊行自92年以來收集的全部統計和調查數據。

2.6 中國統計信息網

http://www.tjcn.org/

國家統計局官網,聚集了海量的全國各級政府各年度的國民經濟和社會發展統計信息,創建了以統計公報爲主,統計年鑑、階段發展數據、統計分析、經濟新聞、主要統計指標排行等爲輔助的多元化統計信息資料庫,目前在線資料已達上萬份。

2.7 figshare

https://figshare.com/

一個研究成果共享的平臺,來自世界的研究成果分享,同時有共享的研究數據。

2.8 OpenStreetMap

https://www.openstreetmap.org/

經過這個網站能夠下載世界各地的地圖數據。

2.9 極海(geohey)

https://geohey.com/

一樣也是能夠提供地圖信息數據的網站;

2.10 github

https://github.com/caesar0301...

若是還嫌數據源不夠,github上有位大神已經爲你們整理好了一個很是全面的數據網站彙總,包含各個細分領域的數據資源(很是全),下面只是部分截圖。

3總結

其實數據是無處不在的,須要咱們平時善於發現和觀察。以上是本次向你們分享的免費數據網站,但願對你們能有所幫助。

關注微信公衆號:Python數據科學,發現更多精彩內容。

相關文章
相關標籤/搜索