跟小白學Python數據分析——數據導入2

Mr.林:今天繼續學習數據導入操做,昨天咱們已經學會了導入CSV數據文件,今天咱們學習導入TXT與EXCEL數據文件。
小白:好啊!
Mr.林:首先是導入TXT數據文件,使用的是Pandas模塊中的read_table函數,數據仍是與昨天同樣,只是存爲了TXT文件。有了昨天CSV數據文件的導入經驗,導入TXT數據文件就輕車熟路了,打開spyder,輸入如下代碼python

1import pandas
2data = pandas.read_table(
3'D:/D/data.txt',
4 engine='python',
5 sep=',',
6 encoding='utf8'
7)

小白:這個比導入CSV文件多了個參數SEP,是設置列分隔符的意思吧?
Mr.林:聰明,一樣我給代碼加上對應的註釋,使用#來添加註釋,這樣解析器就不會執行註釋所在的行的內容。ide

1# 導入pandas模塊
 2import pandas
 3# 使用pandas模塊中的read_table導入data.txt文件
 4data = pandas.read_table(
 5# 第一個參數爲數據文件所在的路徑,由於是字符串須要用單引號引發
 6'D:/D/data.txt',
 7# 第二個參數是爲了解決路徑中包含中文字符沒法導入的問題
 8 engine='python',
 9# 第三個參數是設置列之間的分隔符號
10 sep=',',
11# 第四個參數是設置數據文件對應的編碼格式
12 encoding='utf8'
13)

Mr.林:在變量瀏覽窗口中就能夠看到剛導入的data變量了,雙擊打開data變量,就能夠獲得下面這張表。
跟小白學Python數據分析——數據導入2
Mr.林:接下來是導入EXCEL數據文件,使用的是Pandas模塊中的read_excel函數,輸入如下代碼函數

1# 導入pandas模塊
2import pandas
3# 使用pandas模塊中的read_excel導入data.xlsx文件
4data = pandas.read_excel(
5# 第一個參數爲數據文件所在的路徑,由於是字符串須要用單引號引發
6'D:/D/data.xlsx',
7# 第二個參數是設置須要導入的工做表名稱
8sheet_name='Sheet1'
9)

小白:這個最簡單了,只要設置下須要導入的工做表名稱是吧。
Mr.林:是的。在變量瀏覽窗口中就能夠看到剛導入的data變量了,雙擊打開data變量,就能夠獲得下面這張表。
跟小白學Python數據分析——數據導入2
Mr.林:小白,你發現沒有,id、age這兩列都有不一樣顏色標識。
小白:對呀,這是爲何呢?其餘列爲何沒有?
Mr.林:由於這兩列數據類型爲整數型,你看打開的這個數據框最下面有一個 Background color選項被勾選上,這個功能至關於Excel條件格式中的色階功能,它僅對整數型、浮點型有效,對其餘數據類型無效。
咱們可使用下列命令查看下每列的數據類型學習

1data.dtypes

能夠看到只有id、age是int64型,其餘都是object類型編碼

1id           int64
2reg_date    object
3id_num      object
4gender      object
5birthday    object
6age          int64
7dtype: object

Mr.林:今天就到這,下次咱們繼續學習其餘操做,小白你回去要多多練習,多敲代碼。
跟小白學Python數據分析——數據導入23d

若是你喜歡本文,能夠點擊右下角在看
若是你在跟着學習,請在留言區留言:打卡
若是你剛看到本文,能夠查看本系列歷史文章跟着學習:
跟小白學Python數據分析——Anaconda安裝
跟小白學Python數據分析——使用spyder
跟小白學Python數據分析——數據導入1

長按識別下方二維碼,並關注公衆號
回覆「DR」獲取案例數據
跟小白學Python數據分析——數據導入2 excel

相關文章
相關標籤/搜索