Pandas的三種數據結構:數組
Series
)DataFrame
)Panel
)這些數據結構,構建在Numpy數組之上,這意味着它們很快數據結構
考慮這些數據結構的最好方法是,較高維數據結構是其較低維數據結構的容器。 例如,DataFrame
是Series
的容器,Panel
是DataFrame
的容器。函數
數據結構 | 維數 | 描述 |
---|---|---|
系列 | 1 | 1 D標記均勻數組,大小不變。 |
數據幀 | 2 | 通常2 D標記,大小可變的表結構與潛在的異質類型的列。 |
面板 | 3 | 通常3 D標記,大小可變數組。 |
構建和處理兩個或更多個維數組是一項繁瑣的任務,用戶在編寫函數時要考慮數據集的方向。 可是使用Pandas數據結構,減小了用戶的思考。例如,使用表格數據(DataFrame
),在語義上更有用於考慮索引(行)和列,而不是軸0
和軸1
。spa
可變性code
全部Pandas數據結構是值可變的(能夠更改),除了系列都是大小可變的。系列是大小不變的。索引
注 -
DataFrame
被普遍使用,是最重要的數據結構之一。面板使用少得多。字符串
系列是具備均勻數據的一維數組結構。例如,如下系列是整數:10
,23
,56
,...
的集合。table
關鍵點class
數據幀(DataFrame)是一個具備異構數據的二維數組。 例如,容器
姓名 | 年齡 | 性別 | 等級 |
---|---|---|---|
Maxsu | 25 | 男 | 4.45 |
Katie | 34 | 女 | 2.78 |
Vina | 46 | 女 | 3.9 |
Lia | 女 | x女 | 4.6 |
上表數據以行和列表示。每列表示一個屬性,每行表明一我的。
列的數據類型
上面數據幀中四列的數據類型以下:
列 | 類型 |
---|---|
姓名 | 字符串 |
年齡 | 整數 |
性別 | 字符串 |
等級 | 浮點型 |
關鍵點
面板是具備異構數據的三維數據結構。在圖形表示中很難表示面板。可是一個面板能夠說明爲DataFrame
的容器。
關鍵點