pandas入門01---Series

時間 2019-11-13

標籤 pandas 入門 series 欄目應用數學简体版

原文原文鏈接

爲了入門pandas，須要熟悉兩個經常使用的工具數據結構：Series和DataFrame。數組

今天主要講解Series。數據結構

Series是可以保存任何類型的數據(整數，字符串，浮點數，Python對象等)的一維標記數組。軸標籤統稱爲索引（index）。函數

最簡單的Series能夠僅僅由一個數組造成： obj = pd.Series([4,7,-5,3]) print(obj)工具

結果以下：code

索引在左邊，值在右邊。對象

因爲咱們不爲數據指定索引，因此默認生成的索引是從0到N-1。能夠經過values屬性和index屬性分別得到Series對象的值和索引。blog

print(obj.values)
print(obj.index)

對應結果以下：索引

一般須要建立一個索引序列，用標籤標識每一個數據點：字符串

obj2 = pd.Series([4, 7, -5, 3],index=['d','b','a','c'])
print(obj2)
print(obj2.index)

能夠在數據中選擇數據時使用標籤來進行索引：pandas

print(obj2['a'])
print(obj2['d','c','a'])

也能夠使用布爾值數組進行過濾，例如：

print(obj2[obj2 > 0])
print(np.exp(obj2))

若是已經有數據包含在Python字典中，能夠使用字典生成一個Series:

sdata = {'Ohio':35000,'Texas':71000,'Oregon':16000,'Utah':5000}
obj3 = pd.Series(sdata)
print(obj3)
states = ['California','Ohio','Oregon','Texas']
obj4 = pd.Series(sdata,index=states)
print(obj4)

結果以下：

因爲‘California’沒有出如今sdata鍵中，它對應的值是NaN（Not a Number），這是pandas中標記缺失值或NA值的方式。

pandas用isnull和notnull函數來檢查缺失數據。

pd.isnull(obj4)
pd.notnull(obj4)
# 也能夠這樣表示
obj4.isnull()
obj4.notnull()

Series對象自身和其索引都有name屬性：

obj4.name='population'
obj4.index.name='state'

能夠經過按位置賦值的方式改變索引：

obj.index=['Bob','Steve','Jeff','Ryan']
print(obj)

結果以下：

1. pandas入門
2. pandas入門【二】
3. pandas入門(六)
4. 5_2 Pandas入門
5. Pandas入門
6. pandas入門(八)
7. pandas入門(九)
8. pandas入門(四)
9. pandas入門(二)
10. Pandas庫入門
更多相關文章...
• Memcached入門教程 - NoSQL教程
• Neo4j數據庫入門教程 - NoSQL教程
• YAML 入門教程
• Java Agent入門實戰（一）-Instrumentation介紹與使用

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。