python科學計算和數據分析經常使用庫
- NumPy
NumPy最強大的是n維數組,該庫還包含基本的線性代數函數、傅立葉變換、隨機函數和其餘底層語言(如Fortran、C和C++)集成的工具。
- SciPy
SciPy創建在NumPy基礎上,它是離散傅立葉變換、線性代數、優化和稀疏矩陣等多種高級科學和工程模塊最有用的庫之一。
- Matplotlib
Matplotlib主要用於繪製各類各樣的圖形,從直方圖到線圖、熱力圖,還可使用Latex命令在圖像中添加數學符號。
- Pandas
Pandas主要用於結構化數據的運算和操做,普遍用於數據整理和預處理,其有助於提升Python在數據科學社區的使用。
- Scikit
Scikit主要用於機器學習,該庫創建在NumPy、SciPy和matplotlib基礎上,包含許多有效的機器學習和統計建模工具,如分類、迴歸、聚類和降維。
- Statsmodels
Statsmodels用於統計建模。Statsmodels是一個Python中提供用戶探索數據、估計統計模型和執行統計測試的模組。可用於不一樣類型數據的描述性統計,統計測試,繪圖功能和結果統計。
- Seaborn
Seaborn用於數據可視化。Seaborn是一個用於在Python中製做有吸引力和翔實的統計圖形庫。它是基於matplotlib。Seaborn旨在使可視化成爲探索和理解數據的核心組成。
- Bokeh
Bokeh用於在現代網絡瀏覽器上建立交互式圖表,儀表盤和數據應用程序。它賦予用戶以D3.js的風格生成優雅簡潔的圖形。此外,它具備超大型或流式數據集的高性能交互能力。
- Blaze
Blaze將Numpy和Pandas的能力擴展到分佈式和流式傳輸數據集。它能夠用於從衆多來源(包括Bcolz,MongoDB,SQLAlchemy,Apache Spark,PyTables等)訪問數據。與Bokeh一塊兒,Blaze能夠做爲在巨型數據塊上建立有效可視化和儀表盤的強大的工具。
- Scrapy
Scrapy用於網絡爬蟲。它是獲取特定模式數據的很是有用的框架。它從網站首頁url開始,而後挖掘網站內的網頁內容來收集信息。
- SymPy
SymPy用於符號計算。它具備從基本算術符號到微積分,代數,離散數學和量子物理學的普遍能力。另外一個有用的功能是將計算結果格式化爲LaTeX代碼。
- Requests Requests用於web訪問。它相似於標準python庫urllib2,可是代碼更容易。你會發現與urllib2的微妙差別,可是對於初學者來講,Requests可能更方便。
歡迎關注本站公眾號,獲取更多信息