python文件（概念、基本操做、經常使用操做、文本文件的編碼方式）

時間 2019-12-10

標籤 python 文件概念基本經常使用文本編碼方式欄目 Python 简体版

原文原文鏈接

文件

目標

文件的概念
文件的基本操做
文件/文件夾的經常使用操做
文本文件的編碼方式

01. 文件的概念

1.1 文件的概念和做用

計算機的文件，就是存儲在某種 長期儲存設備 上的一段數據
長期存儲設備包括：硬盤、U 盤、移動硬盤、光盤...

文件的做用python

將數據長期保存下來，在須要的時候使用瀏覽器

CPU	內存	硬盤

1.2 文件的存儲方式

在計算機中，文件是以 二進制 的方式保存在磁盤上的

文本文件和二進制文件

文本文件函數
- 可使用 文本編輯軟件 查看
- 本質上仍是二進制文件
- 例如：python 的源程序
二進制文件編碼
- 保存的內容不是給人直接閱讀的，而是 提供給其餘軟件使用的
- 例如：圖片文件、音頻文件、視頻文件等等
- 二進制文件不能使用 文本編輯軟件 查看

02. 文件的基本操做

2.1 操做文件的套路

在 計算機 中要操做文件的套路很是固定，一共包含三個步驟：spa

打開文件
讀、寫文件
- 讀將文件內容讀入內存
- 寫將內存內容寫入文件
關閉文件

2.2 操做文件的函數/方法

在 Python 中要操做文件須要記住 1 個函數和 3 個方法

序號	函數/方法	說明
01	open	打開文件，而且返回文件操做對象
02	read	將文件內容讀取到內存
03	write	將指定內容寫入文件
04	close	關閉文件

open 函數負責打開文件，而且返回文件對象
read/write/close 三個方法都須要經過 文件對象 來調用

2.3 read 方法 —— 讀取文件

open 函數的第一個參數是要打開的文件名（文件名區分大小寫）
- 若是文件存在，返回 文件操做對象
- 若是文件 不存在，會 拋出異常
read 方法能夠一次性讀入並返回文件的 全部內容
close 方法負責 關閉文件
- 若是 忘記關閉文件，會形成系統資源消耗，並且會影響到後續對文件的訪問
注意：read 方法執行後，會把 文件指針 移動到 文件的末尾

# 1. 打開 - 文件名須要注意大小寫 file = open("README") # 2. 讀取 text = file.read() print(text) # 3. 關閉 file.close()

提示指針

在開發中，一般會先編寫打開和關閉的代碼，再編寫中間針對文件的 讀/寫 操做！

文件指針（知道）

文件指針 標記 從哪一個位置開始讀取數據
第一次打開 文件時，一般 文件指針會指向文件的開始位置
當執行了 read 方法後，文件指針 會移動到 讀取內容的末尾
- 默認狀況下會移動到 文件末尾

思考code

若是執行了一次 read 方法，讀取了全部內容，那麼再次調用 read 方法，還可以得到到內容嗎？

答案視頻

不能
第一次讀取以後，文件指針移動到了文件末尾，再次調用不會讀取到任何的內容

2.4 打開文件的方式

open 函數默認以 只讀方式 打開文件，而且返回文件對象

語法以下：對象

f = open("文件名", "訪問方式")

訪問方式	說明
r	以只讀方式打開文件。文件的指針將會放在文件的開頭，這是默認模式。若是文件不存在，拋出異常
w	以只寫方式打開文件。若是文件存在會被覆蓋。若是文件不存在，建立新文件
a	以追加方式打開文件。若是該文件已存在，文件指針將會放在文件的結尾。若是文件不存在，建立新文件進行寫入
r+	以讀寫方式打開文件。文件的指針將會放在文件的開頭。若是文件不存在，拋出異常
w+	以讀寫方式打開文件。若是文件存在會被覆蓋。若是文件不存在，建立新文件
a+	以讀寫方式打開文件。若是該文件已存在，文件指針將會放在文件的結尾。若是文件不存在，建立新文件進行寫入

提示圖片

頻繁的移動文件指針，會影響文件的讀寫效率，開發中更多的時候會以只讀、只寫的方式來操做文件

寫入文件示例

# 打開文件 f = open("README", "w") f.write("hello python！\n") f.write("今每天氣真好") # 關閉文件 f.close()

2.5 按行讀取文件內容

read 方法默認會把文件的 全部內容 一次性讀取到內存
若是文件太大，對內存的佔用會很是嚴重

`readline` 方法

readline 方法能夠一次讀取一行內容
方法執行後，會把 文件指針 移動到下一行，準備再次讀取

讀取大文件的正確姿式

# 打開文件 file = open("README") while True: # 讀取一行內容 text = file.readline() # 判斷是否讀到內容 if not text: break # 每讀取一行的末尾已經有了一個 `\n` print(text, end="") # 關閉文件 file.close()

2.6 文件讀寫案例 —— 複製文件

目標

用代碼的方式，來實現文件複製過程

小文件複製

打開一個已有文件，讀取完整內容，並寫入到另一個文件

# 1. 打開文件 file_read = open("README") file_write = open("README[復件]", "w") # 2. 讀取並寫入文件 text = file_read.read() file_write.write(text) # 3. 關閉文件 file_read.close() file_write.close()

大文件複製

打開一個已有文件，逐行讀取內容，並順序寫入到另一個文件

# 1. 打開文件 file_read = open("README") file_write = open("README[復件]", "w") # 2. 讀取並寫入文件 while True: # 每次讀取一行 text = file_read.readline() # 判斷是否讀取到內容 if not text: break file_write.write(text) # 3. 關閉文件 file_read.close() file_write.close()

03. 文件/目錄的經常使用管理操做

在終端 / 文件瀏覽器、中能夠執行常規的文件 / 目錄管理操做，例如：
- 建立、重命名、刪除、改變路徑、查看目錄內容、……
在 Python 中，若是但願經過程序實現上述功能，須要導入 os 模塊

文件操做

序號	方法名	說明	示例
01	rename	重命名文件	`os.rename(源文件名, 目標文件名)`
02	remove	刪除文件	`os.remove(文件名)`

目錄操做

序號	方法名	說明	示例
01	listdir	目錄列表	`os.listdir(目錄名)`
02	mkdir	建立目錄	`os.mkdir(目錄名)`
03	rmdir	刪除目錄	`os.rmdir(目錄名)`
04	getcwd	獲取當前目錄	`os.getcwd()`
05	chdir	修改工做目錄	`os.chdir(目標目錄)`
06	path.isdir	判斷是不是文件	`os.path.isdir(文件路徑)`

提示：文件或者目錄操做都支持 相對路徑 和 絕對路徑

04. 文本文件的編碼格式（科普）

文本文件存儲的內容是基於 字符編碼 的文件，常見的編碼有 ASCII 編碼，UNICODE 編碼等

Python 2.x 默認使用 ASCII 編碼格式
Python 3.x 默認使用 UTF-8 編碼格式

4.1 ASCII 編碼和 UNICODE 編碼

`ASCII` 編碼

計算機中只有 256 個 ASCII 字符
一個 ASCII 在內存中佔用 1 個字節 的空間
- 8 個 0/1 的排列組合方式一共有 256 種，也就是 2 ** 8

`UTF-8` 編碼格式

計算機中使用 1~6 個字節 來表示一個 UTF-8 字符，涵蓋了 地球上幾乎全部地區的文字
大多數漢字會使用 3 個字節 表示
UTF-8 是 UNICODE 編碼的一種編碼格式

4.2 Ptyhon 2.x 中如何使用中文

Python 2.x 默認使用 ASCII 編碼格式
Python 3.x 默認使用 UTF-8 編碼格式

在 Python 2.x 文件的 第一行 增長如下代碼，解釋器會以 utf-8 編碼來處理 python 文件

# *-* coding:utf8 *-*

這方式是官方推薦使用的！

也可使用

# coding=utf8

unicode 字符串

在 Python 2.x 中，即便指定了文件使用 UTF-8 的編碼格式，可是在遍歷字符串時，仍然會 以字節爲單位遍歷 字符串
要可以 正確的遍歷字符串，在定義字符串時，須要 在字符串的引號前，增長一個小寫字母 u，告訴解釋器這是一個 unicode 字符串（使用 UTF-8 編碼格式的字符串）

# *-* coding:utf8 *-* # 在字符串前，增長一個 `u` 表示這個字符串是一個 utf8 字符串 hello_str = u"你好世界" print(hello_str) for c in hello_str: print(c)

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。