Python在1991年首次發佈,Python2.0於2000年發佈,8年後Python3.0發佈。根據Stack Overflow在2017年的調查顯示,近45%的數據科學家使用Python做爲主要的編程語言,Python每一次的進步都是它成爲數據分析主流工具的重要因素。web
推薦下我本身建立的Python學習交流羣960410445,這是Python學習交流的地方,無論你是小白仍是大牛,小編都歡迎,不按期分享乾貨,包括我整理的一份適合零基礎學習Python的資料和入門教程。
編程
近年來,Python的被使用性愈來愈高,尤爲是Jupyter Notebook備受你們喜好。根據Ben Frederickson進行的一項調查顯示,Jupyter Notebook在Github上的月活躍用戶(MAU)的佔比在2015年後大幅上升。機器學習
能夠看到,在CDA對數據分析人才等級的劃分中,基本上對Python軟件的應用都有必定的要求。編程語言
既然Python這麼受歡迎,那咱們就有一個問題了,Python一個開源的軟件,到底能夠作什麼呢?工具
Python具備豐富和強大的庫,其語言簡潔、優雅,有時候能夠用幾句話就能表達出C語言幾千行、Java幾百行的代碼。學習
Python能夠作的事情有不少:excel
一、web開發、cdn
二、數據分析、blog
三、數據挖掘、教程
四、機器學習、
五、爬蟲等等
包括它的可視化功能也是和R能夠媲美的。
在我看來,Python近幾年受追捧的一部分緣由和數據分析行業的爆發有着密不可分的關係,隨着各大中小型企業對數據的重視程度的增長,數據分析師需求的大幅上漲,而Python做爲數據分析界最容易入門上手而且作數據分析首選的的分析工具,需求也相應有了暴增。
Python中有兩個最基礎的包:Pandas和Numpy。
Pandas是Python中一種數據分析的包,而Numpy是一個能夠藉助Python實現科學計算的包,能夠計算和儲存大型矩陣。因此,用Python來作數據分析基本需求均可以被實現,這也是Python能夠普遍運用到數據分析中的緣由。
接下來我要提到的就是Python第一次引發我興趣的一個點——爬蟲,我是經過感到這個名詞有趣而後去了解學習Python從而感到Python的有趣之處。爬蟲就是爬取網頁上咱們看到的信息,經過編寫語句、整理獲得咱們想要的數據,進而去作一些其餘的數據分析,固然,這一切都要創建在合法合理的基礎上。下面我給你們分析一個我本身爬蟲的小練習。
這是一個爬取豆瓣tap250電影排行的程序代碼:
爬取到結果整理以後以下(輸出評分排名前十的電影):
使用上面的代碼,我爬取了豆瓣top250電影的影名、類型、國家、時間、簡介、評論等相關信息並最終輸出爲excel表格,這將有助於你劇荒的時候更好的選擇高質量的電影。以上代碼僅僅是我的練習所操做,有更簡潔的語言歡迎你們一塊兒交流。Python真的是一個神奇的工具!