核心庫與統計數組
NumPy數據結構
咱們從科學應用程序庫開始提及,NumPy是該領域的主要軟件包之一。 它旨在處理大型多維數組和矩陣,而且普遍的高級數學函數和實現的方法集合,使得可使用這些對象執行各類操做。機器學習
在這一年中,NumPy有不少更新。 除了錯誤修復和兼容性問題以外,關鍵更新還包括NumPy對象的打印格式。此外,某些函數如今能夠處理Python中可用的任何編碼的文件。函數
SciPy工具
另外一個科學計算核心庫是SciPy。它基於NumPy,並擴展了其功能。 SciPy主數據結構又是一個多維數組,由Numpy實現。該軟件包包含有助於解決線性代數,機率論,積分計算和更多任務的工具。學習
SciPy能夠適配不一樣的操做系統。這一年,Scipy帶來了許多函數的更新,尤爲是優化器也更新了。此外,封裝了許多新的BLAS和LAPACK函數。測試
Pandas字體
Pandas提供了高級數據結構和各類分析工具。該軟件包的一大特點是可以將至關複雜的數據操做轉換爲一個或兩個命令。 Pandas包含許多用於分組,過濾和組合數據的內置方法,以及時間序列功能。優化
Pandas在這一年的更新包括數百個新功能,bug修復和API的更改。編碼
StatsModels
Statsmodels是一個統用於統計數據分析的方法,例如統計模型估計,執行統計測試等。在它的幫助下,您能夠實現許多機器學習方法。
這個庫在不停的更新。今年帶來了時間序列改進和新的計數模型,即GeneralizedPoisson,零膨脹模型和NegativeBinomialP,以及新的多變量方法 - 因子分析,MANOVA和ANOVA中的重複測量。
可視化
Matplotlib
Matplotlib是一個用於建立二維圖表和圖形的低級庫。 藉助它的幫助,您能夠構建各類圖表,從直方圖和散點圖到非笛卡爾座標圖。 此外,許多流行的繪圖庫被設計爲與matplotlib一塊兒使用。
顏色,尺寸,字體,圖例的樣式等都有變化。好比軸圖例的自動對齊,和更友好的配色。