摘要:靈蛇出現,必有異像,Python最熱的領域,估計非數據分析、挖掘領域莫屬了。以Scikit-Learn爲表明的數據分析領域,從這裏開始,即是Python的天下;一邊操做實例,一邊閱讀文檔,再輔助以相關的理論基礎,持之很多天,則大業可成也。
01 靈蛇出現,必有異像java
蛇有靈性,蟒蛇更甚。民間關心打死蛇後出現的種種因果報應現象,相信各位也多有耳聞。身邊聽到的一個是,一個老太打死了一條蛇,第二年她女兒便離婚了。算法
青城山下的一條蟒蛇修行千年終得人生,因而可知,蛇有強大的靈性,並且還告訴咱們一個道理:修得人的身體很難啊!編程
佛法有云:生中國難,得人身難,聞佛法難,生信心難。(注:中國,原指印度,中心之國。)網絡
Python既是一條大蟒蛇,天然算是編程語言中頗有靈性的了。框架
今既得人身,又聞佛法,且學Python,固然得用來作點什麼吧!機器學習
當今,Python最熱的領域,估計非數據分析、數據挖掘莫屬了!編程語言
02 靈蟒Python,事實標準分佈式
只要你沒有過久閉關修練絕世神功,只要你用眼睛餘光瞭解過數據分析相關領域,相信你會有個感受,怎麼到處都有Python的蹤跡啊!工具
每種計算機編程語言,彷佛都有本身成名或適用的領域。oop
在這個你們都在談雲計算、大數據、深度學習的時代,讓咱們來看看,這些領域裏面的表明吧。
以Docker爲表明的雲計算與虛擬化,這是Go的天下。國內使用Go最出名的,當屬七牛了;
以Hadoop爲表明的大數據框架,這是java的天下。國內這塊最強的,固然首推阿里了;
以Spark爲表明的內存迭代框架,這是Scala的天下;
以Scikit-Learn爲表明的數據分析領域,從這裏開始,即是Python的天下;
說句不負責任的話,Python已經成爲數據分析領域裏事實上的標準語言。
03 Python一出,誰與爭鋒
且來看看,Python在數據分析領域的生態圈吧!
a. 基礎庫
Numpy: 矩陣計算與其它大多數框架的數據處理基礎;
Scipy:科學計算庫,提供了不少科學計算工具包和算法;
Matplotlab:專業畫圖工具,話說這個單詞仍是真是在Matlab之間插入了plot這個詞造成的;
Pandas:提供相似於R語言的DataFrame操做,很是方便;
……
b. 機器學習與深度學習
OpenCV:提供圖像識別的不少方便的操做;
Orange:基於圖形界面的機器學習程序,也能夠用Python腳原本操做調用;
Scikit-Learn:前面說了,這是Python在機器學習領域裏面的表明做。尤爲是它的文檔,徹底能夠當成機器學習的參考資料來閱讀了,曾經我向朋友推薦的時候說,說過,把scikit-learn的文檔當成佛經來讀,假以時日,功力定會大增。
Theano:深度學習裏面很是有名的一個框架了,也很是具備表明性。是其它不少框架的基礎。
Keras:基於Theano進行了抽象,建議入門的話使用這個,搭積木同樣地就能夠弄個神經網絡出來了。
NLTK:天然語言處理,提供的功能也很強大。
國內出品的Mxnet的Python接口
……
c. 分佈式機器學習與深度學習
Spark之MLlib的Python接口Pyspark
H2o的Python接口
收費的Graph Create的Python接口
Google最近剛出的TensorFlow的Python接口
三星最近剛出的Veles,目前只提供Python接口
……
也許,新的機器學習或深度學習框架,若是不提供Python接口的話,恐怕會被認爲難以推廣吧。
上面列舉的只是其中一部分,還有不少不少。固然,他們不少並不是是用Python來實現,但都共同的提供了Python接口,甚至好幾個都把Python當成了頭等公民(First-Class)。
在此並不是想說Python這門語言很強大或者複雜,而偏偏相反,得益於Python的簡潔和包容。才讓它在數據挖掘領域有如此的地位。
這即是生態圈的力量,不以我的的意志爲轉移。
04 書山有路,學海無涯
對於想入門數據分析、數據挖掘、機器學習的朋友來講,Python是你值得花時間的選擇。由於,除了上面的工具鏈生態圈,還有書籍和知識傳播的生態圈。
如文章開篇之圖,都是和數據分析相關的書籍,且都是用Python做爲示例來說解。
如如有心,且仔細看圖識字!
05 念念不忘,必有迴響
真如有心於數據領域,甚或欲從事數據科學之職業。請對Python有信心,值得你付出時間。想走機器學習之路,Scikit-learn是你最好的選擇,一邊操做實例,一邊閱讀文檔,再輔助以相關的理論基礎,持之很多天,則大業可成也。