Pandas | 01 數據結構

Pandas的三種數據結構:數組

  • 系列(Series)
  • 數據幀(DataFrame)
  • 面板(Panel)

這些數據結構,構建在Numpy數組之上,這意味着它們很快數據結構

 

維數和描述

考慮這些數據結構的最好方法是,較高維數據結構是其較低維數據結構的容器。 例如,DataFrameSeries的容器,PanelDataFrame的容器。函數

數據結構 維數 描述
系列 1 1D標記均勻數組,大小不變。
數據幀 2 通常2D標記,大小可變的表結構與潛在的異質類型的列。
面板 3 通常3D標記,大小可變數組。

 

構建和處理兩個或更多個維數組是一項繁瑣的任務,用戶在編寫函數時要考慮數據集的方向。 可是使用Pandas數據結構,減小了用戶的思考。例如,使用表格數據(DataFrame),在語義上更有用於考慮索引(行)和列,而不是軸0和軸1spa

 

可變性code

全部Pandas數據結構是值可變的(能夠更改),除了系列都是大小可變的。系列是大小不變的。索引

注 - DataFrame被普遍使用,是最重要的數據結構之一。面板使用少得多。字符串

 

1、系列

系列是具備均勻數據的一維數組結構。例如,如下系列是整數:10,23,56...的集合。table

關鍵點class

  • 均勻數據
  • 尺寸大小不變
  • 數據的值可變

 

2、數據幀

數據幀(DataFrame)是一個具備異構數據的二維數組。 例如,容器

姓名 年齡 性別 等級
Maxsu 25 4.45
Katie 34 2.78
Vina 46 3.9
Lia x女 4.6

上表數據以行和列表示。每列表示一個屬性,每行表明一我的。

 

列的數據類型

上面數據幀中四列的數據類型以下:

類型
姓名 字符串
年齡 整數
性別 字符串
等級 浮點型

 

關鍵點

  • 異構數據
  • 大小可變
  • 數據可變

 

3、面板

面板是具備異構數據的三維數據結構。在圖形表示中很難表示面板。可是一個面板能夠說明爲DataFrame的容器。

關鍵點

  • 異構數據
  • 大小可變
  • 數據可變
相關文章
相關標籤/搜索