人生苦短,我選Pythonpython
前文傳送門git
小白學 Python(1):開篇github
在介紹文件操做以前,咱們先介紹兩個概念,絕對路徑和相對路徑。
先百度下看下百度的解釋:
不知各位同窗看懂了沒,沒看懂我再舉個栗子給各位加深下理解。
好比咱們要描述 Demo.py
的絕對路徑,那麼就是: F:/project/python-learning/base-data-def/Demo.py
。
相對路徑是描述當前位置相對於目標位置的路徑,好比當前咱們存在的路徑是 F:/project/python-learning/
,咱們仍是要描述上面的那個 Demo.py
,那麼它的相對路徑是 ./base-data-def/Demo.py
。
Python 爲咱們提供了打開文件的內置函數 open()
。
經常使用語法:
open(file, mode='r')
完整語法:
open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)
參數說明:
mode 參數經常使用值:
模式 | 描述 |
---|---|
t |
文本模式 (默認)。 |
x |
寫模式,新建一個文件,若是該文件已存在則會報錯。 |
b |
二進制模式。 |
+ |
打開一個文件進行更新(可讀可寫)。 |
r |
以只讀方式打開文件。文件的指針將會放在文件的開頭。這是默認模式。 |
rb |
以二進制格式打開一個文件用於只讀。文件指針將會放在文件的開頭。這是默認模式。通常用於非文本文件如圖片等。 |
r+ |
打開一個文件用於讀寫。文件指針將會放在文件的開頭。 |
rb+ |
以二進制格式打開一個文件用於讀寫。文件指針將會放在文件的開頭。通常用於非文本文件如圖片等。 |
w |
打開一個文件只用於寫入。若是該文件已存在則打開文件,並從開頭開始編輯,即原有內容會被刪除。若是該文件不存在,建立新文件。 |
wb |
以二進制格式打開一個文件只用於寫入。若是該文件已存在則打開文件,並從開頭開始編輯,即原有內容會被刪除。若是該文件不存在,建立新文件。通常用於非文本文件如圖片等。 |
w+ |
打開一個文件用於讀寫。若是該文件已存在則打開文件,並從開頭開始編輯,即原有內容會被刪除。若是該文件不存在,建立新文件。 |
wb+ |
以二進制格式打開一個文件用於讀寫。若是該文件已存在則打開文件,並從開頭開始編輯,即原有內容會被刪除。若是該文件不存在,建立新文件。通常用於非文本文件如圖片等。 |
a |
打開一個文件用於追加。若是該文件已存在,文件指針將會放在文件的結尾。也就是說,新的內容將會被寫入到已有內容以後。若是該文件不存在,建立新文件進行寫入。 |
ab |
以二進制格式打開一個文件用於追加。若是該文件已存在,文件指針將會放在文件的結尾。也就是說,新的內容將會被寫入到已有內容以後。若是該文件不存在,建立新文件進行寫入。 |
a+ |
打開一個文件用於讀寫。若是該文件已存在,文件指針將會放在文件的結尾。文件打開時會是追加模式。若是該文件不存在,建立新文件用於讀寫。 |
ab+ |
以二進制格式打開一個文件用於追加。若是該文件已存在,文件指針將會放在文件的結尾。若是該文件不存在,建立新文件用於讀寫。 |
光說不練假把式,下面開啓咱們第一個示例:
str1 = open('F:/project/python-learning/base-data-def/Demo.py', mode='r').read() print(str1)
打印結果我就不貼出來了,正常打印了咱們前幾篇文章的示例代碼。
根據編碼格式的不一樣,能夠將文件分爲文本字符和二進制字節。
咱們平常看到的都是文本字符,可是文本字符在保存計算機的時候都會轉變成二進制字節,這時候,就要考慮到編碼的問題了。
咱們看下轉換的示例圖:
值得注意的是,在 Python3 中,文件默認的編碼方式是 UTF-8 ,文本字符的經常使用的編碼有 ASCII 和 Unicode 。
說了這麼多,仍是看一個示例代碼吧:
str2 = '好好學習,每天向上' print(type(str2)) a = str2.encode('utf-8') print(type(a)) print(a.decode('utf-8'))
打印結果以下:
<class 'str'> <class 'bytes'> 好好學習,每天向上
能夠看到,咱們將字符串 encode()
編碼之後,類型變成了 byte
。
若是咱們使用編碼 gbk
的方式解碼上面的 a 會怎麼樣呢?
print(a.decode('gbk'))
結果以下:
Traceback (most recent call last): File "F:/project/python-learning/base-file/Demo.py", line 10, in <module> print(a.decode('gbk')) UnicodeDecodeError: 'gbk' codec can't decode byte 0x8a in position 26: incomplete multibyte sequence
告訴咱們不能使用 gbk
來進行解碼操做。
這個其實很好理解,比如咱們將中文翻譯成爲了英文(編碼),而後咱們經過日文翻譯想要將英文翻譯回中文(解碼),那麼這個日文翻譯確定會罵你腦子有病。
前面咱們介紹了經過內置函數來操做文件,咱們還能夠經過 OS 模塊更簡單的l哎操做文件。
OS 模塊是和操做系統相關的模塊。
爲了演示,先創建一個 test.txt
文件。
首先,咱們打開這個文件:
import os os.chdir('F:/project') file = open('test.txt')
讀取這個文件並打印:
print(file.read())
結果以下:
微信公衆號:極客挖掘機
而後咱們在下面再加一些內容:
file.write('關注公衆號,好好學習,每天向上')
而後發現執行報錯了:
Traceback (most recent call last): File "F:/project/python-learning/base-file/Demo.py", line 17, in <module> file.write('關注公衆號,好好學習,每天向上') io.UnsupportedOperation: not writable
從報錯信息能夠看出,是咱們當前讀取權限的問題,由於咱們讀取時是隻讀權限,沒法寫入,因此稍微修改下上面讀取文件的代碼:
import os os.chdir('F:/project') file = open('test.txt', mode='a+') file.write(' \n 關注公衆號,好好學習,每天向上')
執行完成後咱們再看下咱們的測試文件:
寫入成功。
咱們測試一個有意思的事情,若是同一個文件咱們讀取兩次會怎麼樣?
import os os.chdir('F:/project') file = open('test.txt') print(file.read()) print(file.read())
打印結果以下:
微信公衆號:極客挖掘機 關注公衆號,好好學習,每天向上
咱們明明在代碼中打印了兩次,爲何只顯示了一次呢?
由於 read()
讀取全部內容,讀取完後,遊標是指在最後的,再日後讀取確定就讀不到內容了。
好了,本篇的內容就到此爲止了,但願各位同窗能動手練習下示例代碼。
本系列的全部代碼小編都會放在代碼管理倉庫 Github 和 Gitee 上,方便你們取用。