python讀寫、建立文件、文件夾等等

時間 2019-12-06

標籤 python 讀寫建立文件文件夾等等欄目 Python 简体版

原文原文鏈接

python中對文件、文件夾（文件操做函數）的操做須要涉及到os模塊和shutil模塊。python

獲得當前工做目錄，即當前Python腳本工做的目錄路徑: os.getcwd()shell

返回指定目錄下的全部文件和目錄名:os.listdir()windows

函數用來刪除一個文件:os.remove()緩存

刪除多個目錄：os.removedirs（r「c：\python」）函數

檢驗給出的路徑是不是一個文件：os.path.isfile()oop

檢驗給出的路徑是不是一個目錄：os.path.isdir()性能

判斷是不是絕對路徑：os.path.isabs()編碼

檢驗給出的路徑是否真地存:os.path.exists()spa

返回一個路徑的目錄名和文件名:os.path.split() eg os.path.split('/home/swaroop/byte/code/poem.txt') 結果：('/home/swaroop/byte/code', 'poem.txt') unix

分離擴展名：os.path.splitext()

獲取路徑名：os.path.dirname()

獲取文件名：os.path.basename()

運行shell命令: os.system()

讀取和設置環境變量:os.getenv() 與os.putenv()

給出當前平臺使用的行終止符:os.linesep Windows使用'\r\n'，Linux使用'\n'而Mac使用'\r'

指示你正在使用的平臺：os.name 對於Windows，它是'nt'，而對於Linux/Unix用戶，它是'posix'

重命名：os.rename（old， new）

建立多級目錄：os.makedirs（r「c：\python\test」）

建立單個目錄：os.mkdir（「test」）

獲取文件屬性：os.stat（file）

修改文件權限與時間戳：os.chmod（file）

終止當前進程：os.exit（）

獲取文件大小：os.path.getsize（filename）

文件操做：
os.mknod("test.txt") 建立空文件
fp = open("test.txt",w) 直接打開一個文件，若是文件不存在則建立文件

關於open 模式：

w     以寫方式打開，
a     以追加模式打開 (從 EOF 開始, 必要時建立新文件)
r+     以讀寫模式打開
w+     以讀寫模式打開 (參見 w )
a+     以讀寫模式打開 (參見 a )
rb     以二進制讀模式打開
wb     以二進制寫模式打開 (參見 w )
ab     以二進制追加模式打開 (參見 a )
rb+    以二進制讀寫模式打開 (參見 r+ )
wb+    以二進制讀寫模式打開 (參見 w+ )
ab+    以二進制讀寫模式打開 (參見 a+ )

fp.read([size]) #size爲讀取的長度，以byte爲單位

fp.readline([size]) #讀一行，若是定義了size，有可能返回的只是一行的一部分

fp.readlines([size]) #把文件每一行做爲一個list的一個成員，並返回這個list。其實它的內部是經過循環調用readline()來實現的。若是提供size參數，size是表示讀取內容的總長，也就是說可能只讀到文件的一部分。

fp.write(str) #把str寫到文件中，write()並不會在str後加上一個換行符

fp.writelines(seq) #把seq的內容所有寫到文件中(多行一次性寫入)。這個函數也只是忠實地寫入，不會在每行後面加上任何東西。

fp.close() #關閉文件。python會在一個文件不用後自動關閉文件，不過這一功能沒有保證，最好仍是養成本身關閉的習慣。若是一個文件在關閉後還對其進行操做會產生ValueError

fp.flush() #把緩衝區的內容寫入硬盤

fp.fileno() #返回一個長整型的」文件標籤「

fp.isatty() #文件是不是一個終端設備文件（unix系統中的）

fp.tell() #返回文件操做標記的當前位置，以文件的開頭爲原點

fp.next() #返回下一行，並將文件操做標記位移到下一行。把一個file用於for … in file這樣的語句時，就是調用next()函數來實現遍歷的。

fp.seek(offset[,whence]) #將文件打操做標記移到offset的位置。這個offset通常是相對於文件的開頭來計算的，通常爲正數。但若是提供了whence參數就不必定了，whence能夠爲0表示從頭開始計算，1表示以當前位置爲原點計算。2表示以文件末尾爲原點進行計算。須要注意，若是文件以a或a+的模式打開，每次進行寫操做時，文件操做標記會自動返回到文件末尾。

fp.truncate([size]) #把文件裁成規定的大小，默認的是裁到當前文件操做標記的位置。若是size比文件的大小還要大，依據系統的不一樣多是不改變文件，也多是用0把文件補到相應的大小，也多是以一些隨機的內容加上去。

目錄操做：
os.mkdir("file")                   建立目錄
複製文件：
shutil.copyfile("oldfile","newfile")       oldfile和newfile都只能是文件
shutil.copy("oldfile","newfile")            oldfile只能是文件夾，newfile能夠是文件，也能夠是目標目錄
複製文件夾：
shutil.copytree("olddir","newdir")        olddir和newdir都只能是目錄，且newdir必須不存在
重命名文件（目錄）
os.rename("oldname","newname")       文件或目錄都是使用這條命令
移動文件（目錄）
shutil.move("oldpos","newpos")
刪除文件
os.remove("file")
刪除目錄
os.rmdir("dir")只能刪除空目錄
shutil.rmtree("dir")    空目錄、有內容的目錄均可以刪
轉換目錄
os.chdir("path")   換路徑

Python讀寫文件
1.open
使用open打開文件後必定要記得調用文件對象的close()方法。好比能夠用try/finally語句來確保最後能關閉文件。

file_object = open('thefile.txt')
try:
all_the_text = file_object.read( )
finally:
file_object.close( )

注：不能把open語句放在try塊裏，由於當打開文件出現異常時，文件對象file_object沒法執行close()方法。

2.讀文件
讀文本文件
input = open('data', 'r')
#第二個參數默認爲r
input = open('data')

讀二進制文件
input = open('data', 'rb')

讀取全部內容
file_object = open('thefile.txt')
try:
all_the_text = file_object.read( )
finally:
file_object.close( )

讀固定字節
file_object = open('abinfile', 'rb')
try:
    while True:
         chunk = file_object.read(100)
        if not chunk:
            break
         do_something_with(chunk)
finally:
     file_object.close( )

讀每行
list_of_all_the_lines = file_object.readlines( )

若是文件是文本文件，還能夠直接遍歷文件對象獲取每行：

for line in file_object:
process line

3.寫文件
寫文本文件
output = open('data', 'w')

寫二進制文件
output = open('data', 'wb')

追加寫文件
output = open('data', 'w+')

寫數據
file_object = open('thefile.txt', 'w')
file_object.write(all_the_text)
file_object.close( )

寫入多行
file_object.writelines(list_of_text_strings)

注意，調用writelines寫入多行在性能上會比使用write一次性寫入要高。

在處理日誌文件的時候，經常會遇到這樣的狀況：日誌文件巨大，不可能一次性把整個文件讀入到內存中進行處理，例如須要在一臺物理內存爲 2GB 的機器上處理一個 2GB 的日誌文件，咱們可能但願每次只處理其中 200MB 的內容。
在 Python 中，內置的 File 對象直接提供了一個 readlines(sizehint) 函數來完成這樣的事情。如下面的代碼爲例：

file = open('test.log', 'r')sizehint = 209715200 # 200Mposition = 0lines = file.readlines(sizehint)while not file.tell() - position < 0: position = file.tell() lines = file.readlines(sizehint)

每次調用 readlines(sizehint) 函數，會返回大約 200MB 的數據，並且所返回的必然都是完整的行數據，大多數狀況下，返回的數據的字節數會稍微比 sizehint 指定的值大一點（除最後一次調用 readlines(sizehint) 函數的時候）。一般狀況下，Python 會自動將用戶指定的 sizehint 的值調整成內部緩存大小的整數倍。

file在python是一個特殊的類型，它用於在python程序中對外部的文件進行操做。在python中一切都是對象，file也不例外，file有file的方法和屬性。下面先來看如何建立一個file對象：

file(name[, mode[, buffering]])
file()函數用於建立一個file對象，它有一個別名叫open()，可能更形象一些，它們是內置函數。來看看它的參數。它參數都是以字符串的形式傳遞的。name是文件的名字。
mode是打開的模式，可選的值爲r w a U，分別表明讀（默認）寫添加支持各類換行符的模式。用w或a模式打開文件的話，若是文件不存在，那麼就自動建立。此外，用w模式打開一個已經存在的文件時，原有文件的內容會被清空，由於一開始文件的操做的標記是在文件的開頭的，這時候進行寫操做，無疑會把原有的內容給抹掉。因爲歷史的緣由，換行符在不一樣的系統中有不一樣模式，好比在 unix中是一個\n，而在windows中是‘\r\n’，用U模式打開文件，就是支持全部的換行模式，也就說‘\r’ '\n' '\r\n'均可表示換行，會有一個tuple用來存貯這個文件中用到過的換行符。不過，雖然說換行有多種模式，讀到python中統一用\n代替。在模式字符的後面，還能夠加上+ b t這兩種標識，分別表示能夠對文件同時進行讀寫操做和用二進制模式、文本模式（默認）打開文件。
buffering若是爲0表示不進行緩衝;若是爲1表示進行「行緩衝「;若是是一個大於1的數表示緩衝區的大小，應該是以字節爲單位的。

file對象有本身的屬性和方法。先來看看file的屬性。

closed #標記文件是否已經關閉，由close()改寫
encoding #文件編碼
mode #打開模式
name #文件名
newlines #文件中用到的換行模式，是一個tuple
softspace #boolean型，通常爲0，聽說用於print

file的讀寫方法：

F.read([size]) #size爲讀取的長度，以byte爲單位
F.readline([size])
#讀一行，若是定義了size，有可能返回的只是一行的一部分
F.readlines([size])
#把文件每一行做爲一個list的一個成員，並返回這個list。其實它的內部是經過循環調用readline()來實現的。若是提供size參數，size是表示讀取內容的總長，也就是說可能只讀到文件的一部分。
F.write(str)
#把str寫到文件中，write()並不會在str後加上一個換行符
F.writelines(seq)
#把seq的內容所有寫到文件中。這個函數也只是忠實地寫入，不會在每行後面加上任何東西。
file的其餘方法：

F.close() #關閉文件。python會在一個文件不用後自動關閉文件，不過這一功能沒有保證，最好仍是養成本身關閉的習慣。若是一個文件在關閉後還對其進行操做會產生ValueError F.flush() #把緩衝區的內容寫入硬盤 F.fileno() #返回一個長整型的」文件標籤「 F.isatty() #文件是不是一個終端設備文件（unix系統中的） F.tell() #返回文件操做標記的當前位置，以文件的開頭爲原點 F.next() #返回下一行，並將文件操做標記位移到下一行。把一個file用於for ... in file這樣的語句時，就是調用next()函數來實現遍歷的。 F.seek(offset[,whence]) #將文件打操做標記移到offset的位置。這個offset通常是相對於文件的開頭來計算的，通常爲正數。但若是提供了whence參數就不必定了，whence能夠爲0表示從頭開始計算，1表示以當前位置爲原點計算。2表示以文件末尾爲原點進行計算。須要注意，若是文件以a或a+的模式打開，每次進行寫操做時，文件操做標記會自動返回到文件末尾。 F.truncate([size]) #把文件裁成規定的大小，默認的是裁到當前文件操做標記的位置。若是size比文件的大小還要大，依據系統的不一樣多是不改變文件，也多是用0把文件補到相應的大小，也多是以一些隨機的內容加上去。

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。