第十一篇：python之文件處理

時間 2019-11-21

原文原文鏈接

咱們用python或其餘語言編寫的應用程序若想要把數據永久保存下來，必需要保存於硬盤中，這就涉及到應用程序要操做硬件，衆所周知，應用程序是沒法直接操做硬件的，這就用到了操做系統。操做系統把複雜的硬件操做封裝成簡單的接口給用戶/應用程序使用，其中文件就是操做系統提供給應用程序來操做硬盤虛擬概念，用戶或應用程序經過操做文件，能夠將本身的數據永久保存下來。python

文件打開與關閉 -- open()函數

在python中，使用open函數，打開一個已經存在的文件，或者新建一個新文件。linux

函數語法 open(name[, mode[, buffering[,encoding]]]) vim

name : 一個包含了你要訪問的文件名稱的字符串值(區分絕對路徑和相對路徑)。
mode : mode 決定了打開文件的模式：只讀，寫入，追加等。全部可取值見以下的徹底列表。這個參數是非強制的，默認文件訪問模式爲只讀(r)。
encoding:是指明對文件編碼，僅適用於文本文件。windows

newline=None：查看操做系統的換行符（window的是\r\n)，不管何種平臺統一用\n便可編輯器

對於文件的操做結束以後，使用close()來關閉文件函數

#1. 打開文件，獲得文件句柄並賦值給一個變量
f=open('./test.txt','r',encoding='utf-8') #默認打開模式就爲r

#2. 經過句柄對文件進行操做
data=f.read()

#3. 關閉文件
f.close()

with ... open與open的區別:測試

關鍵字with當再也不須要訪問文件後將其關閉。這可以讓Python去肯定：你只管打開文件，並在須要時使用它，Python自會在合適的時候自動將其關閉。若是調用open()和close()來打開和關閉文件,一旦程序存在bug，致使close()語句未執行，文件將不會關閉，一直佔用內存資源。編碼

with open('./test.txt','r') as f:
    print(f.read())

f=open('test.txt','r')的過程分析spa

一、由應用程序（python）向操做系統發起系統調用open(...)。操作系統

二、操做系統打開該文件，並返回一個文件句柄給應用程序。
三、應用程序將文件句柄賦值給變量f。

強調第一點：
打開一個文件包含兩部分資源：操做系統級打開的文件+應用程序的變量。在操做完畢一個文件時，必須把與該文件的這兩部分資源一個不落地回收，回收方法爲：
一、f.close() #回收操做系統級打開的文件
二、del f #回收應用程序級的變量

其中del f必定要發生在f.close()以後，不然就會致使操做系統打開的文件尚未關閉，白白佔用資源，
而python自動的垃圾回收機制決定了咱們無需考慮del f，這就要求咱們，在操做完畢文件後，必定要記住f.close()

雖然我這麼說，可是不少同窗仍是會很不要臉地忘記f.close(),對於這些不長腦子的同窗，咱們推薦傻瓜式操做方式：使用with關鍵字來幫咱們管理上下文
with open('a.txt','w') as f:
    pass
 
with open('a.txt','r') as read_f,open('b.txt','w') as write_f:
    data=read_f.read()
    write_f.write(data)

強調第二點：
f=open(...)是由操做系統打開文件，那麼若是咱們沒有爲open指定編碼，那麼打開文件的默認編碼很明顯是操做系統說了算了，操做系統會用本身的默認編碼去打開文件，在windows下是gbk，在linux下是utf-8。
這就用到了上節課講的字符編碼的知識：若要保證不亂碼，文件以什麼方式存的，就要以什麼方式打開。
f=open('a.txt','r',encoding='utf-8')

文件訪問模式

對於非文本文件，咱們只能使用b模式，"b"表示以字節的方式操做，以b方式打開時，讀取到的內容是字節類型，寫入時也須要提供字節類型，不能指定編碼（而全部文件也都是以字節的形式存儲的，使用這種模式無需考慮文本文件的字符編碼、圖片文件的jgp格式、視頻文件的avi格式）

操做文件的方法

文件內光標移動

一: read(3)：

　　1. 文件打開方式爲文本模式時，表明讀取3個字符

　　2. 文件打開方式爲b模式時，表明讀取3個字節

二: 其他的文件內光標移動都是以字節爲單位如seek，tell，truncate

注意：

　　1. seek有三種移動方式0，1，2，其中1和2必須在b模式下進行，但不管哪一種模式，都是以bytes爲單位移動的

　　2. truncate是截斷文件，因此文件的打開方式必須可寫，可是不能用w或w+等方式打開，由於那樣直接清空文件了，因此truncate要在r+或a或a+等模式下測試效果

文件修改

文件的數據是存放於硬盤上的，於是只存在覆蓋、不存在修改這麼一說，咱們平時看到的修改文件，都是模擬出來的效果，具體的說有兩種實現方式：

方式一：將硬盤存放的該文件的內容所有加載到內存，在內存中是能夠修改的，修改完畢後，再由內存覆蓋到硬盤（word，vim，nodpad++等編輯器）

import os

with open('a.txt') as read_f,open('.a.txt.swap','w') as write_f:
    data=read_f.read() #所有讀入內存,若是文件很大,會很卡
    data=data.replace('alex','SB') #在內存中完成修改

    write_f.write(data) #一次性寫入新文件

os.remove('a.txt')
os.rename('.a.txt.swap','a.txt')

方式二：將硬盤存放的該文件的內容一行一行地讀入內存，修改完畢就寫入新文件，最後用新文件覆蓋源文件。

import os

with open('a.txt') as read_f,open('.a.txt.swap','w') as write_f:
    for line in read_f:
        line=line.replace('alex','SB')
        write_f.write(line)

os.remove('a.txt')
os.rename('.a.txt.swap','a.txt')

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。