文件操做

一 介紹

計算機系統分爲:計算機硬件,操做系統,應用程序三部分。
咱們用python或其餘語言編寫的應用程序若想要把數據永久保存下來,必需要保存於硬盤中,這就涉及到應用程序要操做硬件,衆所周知,應用程序是沒法直接操做硬件的,這就用到了操做系統。操做系統把複雜的硬件操做封裝成簡單的接口給用戶/應用程序使用,其中文件就是操做系統提供給應用程序來操做硬盤虛擬概念,用戶或應用程序經過操做文件,能夠將本身的數據永久保存下來。
文件路徑:
相對路徑:Linux和os x中用/,Windows中用,該位置相對於當前程序所在目錄
絕對路徑:同上,讀取系統任何地方文件,因爲在Python中是轉義符建議路徑前加上r
有了文件的概念,咱們無需再去考慮操做硬盤的細節,只須要關注操做文件的流程:
一、打開文件,獲得文件句柄並賦值給一個變量python

f=open('a.txt','r',encoding='utf-8')  # 默認打開模式就爲r

二、經過句柄對文件進行操做linux

data=f.read()

三、關閉文件windows

f.close()  #操做過程存儲在內存與緩存中,在程序結束或者close以後寫入磁盤

上下文與回收
打開一個文件包含兩部分資源:操做系統級打開的文件+應用程序的變量。在操做完畢一個文件時,必須把與該文件的這兩部分資源一個不落地回收,回收方法爲:
一、f.close() #回收操做系統級打開的文件
二、del f #回收應用程序級的變量
注意:其中del f必定要發生在f.close()以後,不然就會致使操做系統打開的文件尚未關閉,白白佔用資源,而python自動的垃圾回收機制決定了咱們無需考慮del f,這就要求咱們,在操做完畢文件後,必定要記住f.close()。若是程序存在bug,致使close()未執行,文件不會關閉。緩存

whit管理上下文:函數

with open('a.txt','w') as f:
    pass 
with open('a.txt','r') as read_f,open('b.txt','w') as write_f:
    data=read_f.read()
    write_f.write(data)

注意:當with代碼塊執行完畢時,內部會自動關閉並釋放文件資源。open()返回的文件對象只在with內可用,若是要在外部訪問需將with內建立列表,再從外部使用
文件編碼工具

f=open(...)是由操做系統打開文件,那麼若是咱們沒有爲open指定編碼,操做系統會用本身的默認編碼去打開文件,在windows下是gbk,在linux下是utf-8。
f=open('a.txt','r',encoding='utf-8')

二 文件操做

操做文件時,通常須要經歷以下步驟:
一、打開文件
文件句柄 = file('文件路徑', '模式')
注:python中打開文件有兩種方式,即:open(...) 和 file(...) ,本質上前者在內部會調用後者來進行文件操做,推薦使用 open。測試

打開文件的模式有:優化

打開文件的模式有(默認爲文本模式):編碼

  • r :只讀模式【默認模式,文件必須存在,不存在則拋出異常】
  • w :只寫模式【不可讀;不存在則建立;存在則清空原內容寫入新內容】
  • a :追加寫模式【不可讀;不存在則建立;存在則在光標位置追加內容】

非文本文件,咱們只能使用b模式,"b"表示以字節的方式操做(無需考慮文本、圖片、視頻的格式):操作系統

  • rb :只讀模式
  • wb :修改並讀取
  • ab :追加字節

注意:以b方式打開時,讀取到的內容是字節類型,寫入時也須要提供字節類型,不能指定編碼

其餘模式

  • "+" :表示能夠同時讀寫某個文件
  • r+ :讀寫【可讀,可寫】#追加寫,文件光標位置處,默認在開始位置
  • w+ :寫讀【可讀,可寫】#清除覆蓋原有內容,默認光標位置在開始,用seek讀
  • a+ :寫讀【可讀,可寫】#不清空在最後位置追加,用seek讀。
  • x :只寫模式【不可讀】#不存在則建立,存在則報錯
  • x+ :寫讀【可讀,可寫】
  • "U" :表示在讀取時,將 r n rn自動轉換成 n (與r或r+模式同使用)

    rU     r+U

操做文件方法

import sys #系統函數

print(f.tell()) #返回光標位置

f.read() #從光標初讀取全部內容,並移動到末尾返回空字符串即空行

f.read(3) #文本模式讀三個字符,b模式讀取3個字節

f.readline() #讀取一行內容,光標移動到第二行首部

f.readlines() #讀取全部行內容,存放於列表中,在循環迭代時獲取

f.xreadlines() #可用於逐行讀取文件,非所有

f.readinto() #讀取到緩衝區,不要用,將被遺棄

f.seek(0) #指定文件中指針位置,0表明開始位置,不一樣於read。

f.seek(3,2) #從第三個字節開始打印,seek應用,如斷點續傳

f.tell() #獲取當前指針位置

f.truncate() #截斷文件,保留指定以前的數據。
注意:文件的打開方式必須可寫,不能用w或w+等方式打開,由於那樣直接清空文件了,因此truncate要在r+或a或a+等模式下測試效果.

f.write(「xx」) #文本模式寫入緩存,b模式須要加.encode('utf-8')

f.flush() #馬上從內存刷到磁盤中及屏幕上

f.time.sleep(100)#100秒後寫入磁盤

f.close() #寫入磁盤或程序結束後寫入磁盤

f.stdout.write(「xx」) #向屏幕輸出內容,表明文件寫、輸出,先進了緩存

f.write('1111n222n') #針對文本模式的寫,須要本身寫換行符

f.write('1111n222n'.encode('utf-8')) #針對b模式的寫,須要本身寫換行符

f.writelines(['333n','444n']) #文件模式,字符串寫入文件

f.writelines([bytes('333n',encoding='utf8'),'444n'.encode('utf-8')]) #b模式

f.readable() #文件是否可讀

f.writable() #文件是否可寫

f.close() #關閉文件

f.closed #文件是否關閉

f.encoding #若是文件打開模式爲b,不然沒有該屬性

f.fileno() #文件描述符

f.isatty() #判斷文件是不是贊成tty設備

f.next() #獲取下一行數據,不存在時報錯

練習:

打印一首詩
f 讀取一行,執行完後被回收,優化內存

利用b模式,編寫一個cp工具,要求以下:

  1. 既能夠拷貝文本又能夠拷貝視頻,圖片等文件
  2. 用戶一旦參數錯誤,打印命令的正確使用方法,如usage:cp source_file target_file

請輸入代碼
相關文章
相關標籤/搜索