令筆者對pandas印象最爲深入的一件事,就是在pandas中已經內置了不少數據導入導出方法,然而本人並不瞭解,在一次小項目的工做中曾手寫了一個從excel表格導入數據到DataFrame的python腳本。這個糗事讓筆者深感代碼能力急需增強!html
爲了讓那次教訓刻骨銘心,也爲了不廣大讀者再走相似的彎路,本文主要介紹關於pandas的數據導入導出功能,理解起來很是簡單。
pandas支持的導入導出數據格式多種多樣,有csv,excel,sql,json,html,pickle等。
雖然支持衆多數據格式,但各種數據格式導入導出的操做方法千篇一概,瞭解其中一個便能掌握所有,於是本文以數據分析中常見的csv格式爲例,介紹pandas的數據導入導出功能。python
例中,要讀取的csv文件與代碼程序在同一目錄下:sql
exam.csv文件內容以下:json
程序將csv文件讀入到data變量中:函數
從中能夠看到:pandas默認會將csv文件的第一行做爲列名導入進來。excel
若是導入的數據文件中沒有保存列名,則在導入時能夠手動添加列名,示例以下:htm
先複製一份上述csv文件,去掉原有列名部分,其他不變:
blog
在讀入數據時,指定列名:
索引
爲方便起見,咱們將剛纔讀入的數據再次導出到同目錄下的daochu.csv文件:數據分析
查看daochu.csv文件中的內容:
能夠看到:導出時選擇了三列數據,而且輸出列名(header=True)與行索引(index=True),索引默認是「0,1,2,3」的形式。 導出csv文件函數的參數比較多,能夠對導出後的文件內容進行多種設定,具體每個參數的做用效果還要靠諸位親自探索。