存儲和處理大型矩陣。 這個是很基礎的擴展,其他的擴展都是以此爲基礎。 快速學習入口 https://docs.scipy.org/doc/numpy-dev/user/quickstart.htmlhtml
基於NumPy 的一種工具,爲了解決數據分析任務而建立的。 Pandas 歸入了大量庫和一些標準的數據模型,提供了高效地操做大型數據集所需的工具。 最具備統計意味的工具包,某些方面優於R軟件。 數據結構有一維的Series,二維的DataFrame(相似於Excel或者SQL中的表,若是深刻學習,會發現Pandas和SQL類似的地方不少,例如merge函數), 三維的Panel (Pan(el) + da(ta) + s,知道名字的由來了吧)。 學習pandas要掌握: 彙總和計算描述統計,處理缺失數據 ,層次化索引 清理、轉換、合併、重塑、GroupBy技術 日期和時間數據類型及工具(日期處理方便地飛起)。 http://pandas.pydata.org/pandas-docs/stable/10min.htmlpython
python中最著名的繪圖系統.不少其餘的繪圖例如seaborn(針對pandas繪圖而來)也是由其封裝而成。 這個繪圖系統操做起來很複雜,和R的ggplot,lattice繪圖相比顯得望而卻步,這也是爲何我我的不丟棄R的緣由. 可是matplotlib的複雜給其帶來了很強的定製性。其具備面向對象的方式及Pyplot的經典高層封裝。 須要掌握的是: 散點圖,折線圖,條形圖,直方圖,餅狀圖,箱形圖的繪製。 繪圖的三大系統:pyplot,pylab(不推薦),面向對象 座標軸的調整,添加文字註釋,區域填充,及特殊圖形patches的使用 金融的同窗注意的是:能夠直接調用Yahoo財經數據繪圖. http://matplotlib.org/users/pyplot_tutorial.html數據結構
在NumPy庫的基礎上增長了衆多的數學、科學以及工程計算中經常使用的庫函數。 方便、易於使用、專爲科學和工程設計的Python工具包. 它包括統計,優化,整合,線性代數模塊,傅里葉變換,信號和圖像處理,常微分方程求解器等等。函數
Numpy是以矩陣爲基礎的數學計算模塊,純數學。 Scipy基於Numpy,科學計算庫,有一些高階抽象和物理模型。比方說作個傅立葉變換,這是純數學的,用Numpy;作個濾波器,這屬於信號處理模型了,在Scipy裏找。 Pandas提供了一套名爲DataFrame的數據結構,比較契合統計分析中的表結構,而且提供了計算接口,可用Numpy或其它方式進行計算。工具