python 數據分析庫介紹

1 引言

高效處理數據的python工具:html

與外界進行交互:python

  讀寫各類文件格式和數據庫數據庫

準備:數組

  對數據進行清理、修整、整合、規範化、重塑、切片切換、變形等處理以便進行分析數據結構

轉換:機器學習

  對數據集作一些數學和統計運算以產生新的數據集。你如說,根據分組變量對一個大表進行聚合函數

建模和計算:工具

  將數據進行統計模型、機器學習或其餘計算工具聯繫起來性能

展現:學習

  建立交互式或靜態的圖片或文字摘要

2 重要的庫

(1)NumPy(Numerical Python)

菜鳥教程

numerical  /njuː'merɪk(ə)l/  /nʊ'mɛrɪkl/N

NumPy是python科學計算的基礎包

 /nʌm/ py

一維數組:[ ];二維數組:[ [ ],[ ] ];三維數組:[ [ [ ],[ ] ],[ [ ],[ ] ] ]

NumPy 是一個運行速度很是快的數學庫,主要用於數組計算,包含: 矩陣運算
一個強大的N維數組對象 ndarray 用於對數組執行元素級計算以及直接對數組執行數學運算的函數
用於毒血硬盤上基於數組的數據集個工具 整合 C
/C++/Fortran 代碼的工具 線性代數、傅里葉變換、隨機數生成等功能

 

import numpy as np

(2)pandas

pandas是numpy的升級版本

提供了使咱們可以快速便捷地處理結構化數據的大量數據結構和函數

pandas兼具Numpy高性能的數組計算功能以及電子表格和關係型數據庫(如SQL)靈活的數據處理功能。他提供了複雜的精細索引功能

以便便捷完成重塑、切片和切塊、聚合以及選取數據子集等操做

首先須要瞭解他主要兩個數據結構:Series和DataFrame。

(3)matplotlib數據可視化神器

[mæt'plɒtlib] 美式讀音:[mæt'plotlib] 

是最流行的用於繪製數據圖表的Python庫

import matplotlib.pyplot as plt線圖; 散點圖; 等高線圖; 條形圖; 柱狀圖; 3D 圖形, 甚至是圖形動畫等等.
相關文章
相關標籤/搜索