今天咱們來學習一下Pandas庫,前面咱們講了Numpy庫的學習函數
接下來咱們學習一下比較重要的庫Pandas庫,這個庫比Numpy庫還重要學習
Pandas庫是在Numpy庫上進行了封裝,至關於高級Numpy庫spa
在數據處理方面,運用Pandas庫,也是很是多的,廢話很少說code
先說第一個函數,read_csv,讀取CSV數據文件blog
import pandas food = pandas.read_csv("food_info.csv") print(type(food)) print(food.dtypes)
這裏我打印了一下Type,能夠看到類型爲DataFrame,這個類型也是Pandas中,的核心類型字符串
下面我打印了一下,dtypes。能夠看到,下面也是在pandas中很是經常使用的幾種類型。get
int64,float64這兩種就不用多說了。可是會發現一個新的類型。object類型pandas
這個類型就至關於str類型,也就是字符串類型值。class
而後接着,咱們在運行一個函數import
food.head()
這個函數的做用是,將咱們數據中的,前5行打印出來。結果以下,
那麼若是咱們想讓數據顯示多條怎麼處理呢?
food.head(8),只須要在這個函數中添加參數便可
能夠顯示前面的,那麼確定能夠顯示後面的,
food.tail(4)
這個方法至關於顯示最後面的4條數據
如圖所示,顯示出最後的4行數據,能夠看到跟數據中的數據作下對比,是同樣的
那麼若是獲取到數據表中,每一列的列名指標呢?
print(food.columns)
使用這個方便,能夠或獲得每一個列表示的列名,結果是一個list,以下圖
還有一個要說的就是,若是看這個表的維度呢?咱們直接在講Numpy的時候講過,若是查看矩陣的維度,用法同樣,shape方法
print(food.shape)
能夠看到以下結果,表示,當前數據,有8618 個樣本,36個指標,36列
咱們如何從pandas中獲取到某個數據呢?使用以下方法
print(food.loc[0])
這裏咱們能夠看到,咱們將第一個樣本的所有值取出來了。對比結果。
那麼若是咱們想去單獨某條數據,那麼只須要修改[0]到你須要的數據上便可。這裏下標從0開始。
大小超過數據的樣本集,會直接報錯。
pandas中經常使用的數據類型以下
object 就是咱們常說的字符串類型
int 整型
float 浮點型
bool 布爾型
今天就先講到這裏我,感謝你們的閱讀,謝謝!!
更多好文章,請訪問:https://www.yuanrenxue.com/