跟小白學Python數據分析——數據導入2

時間 2021-01-02

標籤 python ide 函數學習編碼 3d excel code blog 字符串欄目 Python 简体版

原文原文鏈接

Mr.林：今天繼續學習數據導入操做，昨天咱們已經學會了導入CSV數據文件，今天咱們學習導入TXT與EXCEL數據文件。
小白：好啊！
Mr.林：首先是導入TXT數據文件，使用的是Pandas模塊中的read_table函數，數據仍是與昨天同樣，只是存爲了TXT文件。有了昨天CSV數據文件的導入經驗，導入TXT數據文件就輕車熟路了，打開spyder，輸入如下代碼python

1import pandas
2data = pandas.read_table(
3'D:/D/data.txt',
4 engine='python',
5 sep=',',
6 encoding='utf8'
7)

小白：這個比導入CSV文件多了個參數SEP，是設置列分隔符的意思吧？
Mr.林：聰明，一樣我給代碼加上對應的註釋，使用#來添加註釋，這樣解析器就不會執行註釋所在的行的內容。ide

1# 導入pandas模塊
 2import pandas
 3# 使用pandas模塊中的read_table導入data.txt文件
 4data = pandas.read_table(
 5# 第一個參數爲數據文件所在的路徑，由於是字符串須要用單引號引發
 6'D:/D/data.txt',
 7# 第二個參數是爲了解決路徑中包含中文字符沒法導入的問題
 8 engine='python',
 9# 第三個參數是設置列之間的分隔符號
10 sep=',',
11# 第四個參數是設置數據文件對應的編碼格式
12 encoding='utf8'
13)

Mr.林：在變量瀏覽窗口中就能夠看到剛導入的data變量了，雙擊打開data變量，就能夠獲得下面這張表。

Mr.林：接下來是導入EXCEL數據文件，使用的是Pandas模塊中的read_excel函數，輸入如下代碼函數

1# 導入pandas模塊
2import pandas
3# 使用pandas模塊中的read_excel導入data.xlsx文件
4data = pandas.read_excel(
5# 第一個參數爲數據文件所在的路徑，由於是字符串須要用單引號引發
6'D:/D/data.xlsx',
7# 第二個參數是設置須要導入的工做表名稱
8sheet_name='Sheet1'
9)

小白：這個最簡單了，只要設置下須要導入的工做表名稱是吧。
Mr.林：是的。在變量瀏覽窗口中就能夠看到剛導入的data變量了，雙擊打開data變量，就能夠獲得下面這張表。

Mr.林：小白，你發現沒有，id、age這兩列都有不一樣顏色標識。
小白：對呀，這是爲何呢？其餘列爲何沒有？
Mr.林：由於這兩列數據類型爲整數型，你看打開的這個數據框最下面有一個 Background color選項被勾選上，這個功能至關於Excel條件格式中的色階功能，它僅對整數型、浮點型有效，對其餘數據類型無效。
咱們可使用下列命令查看下每列的數據類型學習

1data.dtypes

能夠看到只有id、age是int64型，其餘都是object類型編碼

1id           int64
2reg_date    object
3id_num      object
4gender      object
5birthday    object
6age          int64
7dtype: object

Mr.林：今天就到這，下次咱們繼續學習其餘操做，小白你回去要多多練習，多敲代碼。
3d

若是你喜歡本文，能夠點擊右下角在看
若是你在跟着學習，請在留言區留言：打卡
若是你剛看到本文，能夠查看本系列歷史文章跟着學習：
跟小白學Python數據分析——Anaconda安裝
跟小白學Python數據分析——使用spyder
跟小白學Python數據分析——數據導入1

長按識別下方二維碼，並關注公衆號
回覆「DR」獲取案例數據
excel

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。