Mr.林:今天繼續學習數據導入操做,昨天咱們已經學會了導入CSV數據文件,今天咱們學習導入TXT與EXCEL數據文件。
小白:好啊!
Mr.林:首先是導入TXT數據文件,使用的是Pandas模塊中的read_table函數,數據仍是與昨天同樣,只是存爲了TXT文件。有了昨天CSV數據文件的導入經驗,導入TXT數據文件就輕車熟路了,打開spyder,輸入如下代碼python
1import pandas 2data = pandas.read_table( 3'D:/D/data.txt', 4 engine='python', 5 sep=',', 6 encoding='utf8' 7)
小白:這個比導入CSV文件多了個參數SEP,是設置列分隔符的意思吧?
Mr.林:聰明,一樣我給代碼加上對應的註釋,使用#來添加註釋,這樣解析器就不會執行註釋所在的行的內容。ide
1# 導入pandas模塊 2import pandas 3# 使用pandas模塊中的read_table導入data.txt文件 4data = pandas.read_table( 5# 第一個參數爲數據文件所在的路徑,由於是字符串須要用單引號引發 6'D:/D/data.txt', 7# 第二個參數是爲了解決路徑中包含中文字符沒法導入的問題 8 engine='python', 9# 第三個參數是設置列之間的分隔符號 10 sep=',', 11# 第四個參數是設置數據文件對應的編碼格式 12 encoding='utf8' 13)
Mr.林:在變量瀏覽窗口中就能夠看到剛導入的data變量了,雙擊打開data變量,就能夠獲得下面這張表。
Mr.林:接下來是導入EXCEL數據文件,使用的是Pandas模塊中的read_excel函數,輸入如下代碼函數
1# 導入pandas模塊 2import pandas 3# 使用pandas模塊中的read_excel導入data.xlsx文件 4data = pandas.read_excel( 5# 第一個參數爲數據文件所在的路徑,由於是字符串須要用單引號引發 6'D:/D/data.xlsx', 7# 第二個參數是設置須要導入的工做表名稱 8sheet_name='Sheet1' 9)
小白:這個最簡單了,只要設置下須要導入的工做表名稱是吧。
Mr.林:是的。在變量瀏覽窗口中就能夠看到剛導入的data變量了,雙擊打開data變量,就能夠獲得下面這張表。
Mr.林:小白,你發現沒有,id、age這兩列都有不一樣顏色標識。
小白:對呀,這是爲何呢?其餘列爲何沒有?
Mr.林:由於這兩列數據類型爲整數型,你看打開的這個數據框最下面有一個 Background color選項被勾選上,這個功能至關於Excel條件格式中的色階功能,它僅對整數型、浮點型有效,對其餘數據類型無效。
咱們可使用下列命令查看下每列的數據類型學習
1data.dtypes
能夠看到只有id、age是int64型,其餘都是object類型編碼
1id int64 2reg_date object 3id_num object 4gender object 5birthday object 6age int64 7dtype: object
Mr.林:今天就到這,下次咱們繼續學習其餘操做,小白你回去要多多練習,多敲代碼。3d
長按識別下方二維碼,並關注公衆號
回覆「DR」獲取案例數據 excel