Python的文件操做

時間 2020-07-22

標籤 python 文件欄目 Python 简体版

原文原文鏈接

python中對文件、文件夾（文件操做函數）的操做須要涉及到os模塊和shutil模塊。html

獲得當前工做目錄，即當前Python腳本工做的目錄路徑: os.getcwd()python

返回指定目錄下的全部文件和目錄名:os.listdir()linux

函數用來刪除一個文件:os.remove()shell

刪除多個目錄：os.removedirs（r「c：\python」）函數

檢驗給出的路徑是不是一個文件：os.path.isfile()oop

檢驗給出的路徑是不是一個目錄：os.path.isdir()spa

判斷是不是絕對路徑：os.path.isabs()unix

檢驗給出的路徑是否真地存:os.path.exists()code

返回一個路徑的目錄名和文件名:os.path.split() htm

eg os.path.split('/home/swaroop/byte/code/poem.txt')

結果：('/home/swaroop/byte/code', 'poem.txt')

分離擴展名：os.path.splitext()

獲取路徑名：os.path.dirname()

獲取文件名：os.path.basename()

運行shell命令: os.system()

讀取和設置環境變量:os.getenv() 與os.putenv()

給出當前平臺使用的行終止符:os.linesep Windows使用'\r\n'，Linux使用'\n'而Mac使用'\r'

指示你正在使用的平臺：os.name 對於Windows，它是'nt'，而對於Linux/Unix用戶，它是'posix'

重命名：os.rename（old， new）

建立多級目錄：os.makedirs（r「c：\python\test」）

建立單個目錄：os.mkdir（「test」）

獲取文件屬性：os.stat（file）

修改文件權限與時間戳：os.chmod（file）

終止當前進程：os.exit（）

獲取文件大小：os.path.getsize（filename）

今天在嘗試寫一個腳本遍歷目錄下以及子目錄下的全部文件時，有用到 walk()方法，其語法格式如：

os.walk(top[, topdown=True[, onerror=None[, followlinks=False]]])

top -- 是你所要便歷的目錄的地址, 返回的是一個三元組(root,dirs,files)。

root 所指的是當前正在遍歷的這個文件夾的自己的地址

dirs 是一個 list ，內容是該文件夾中全部的目錄的名字(不包括子目錄)

files 一樣是 list , 內容是該文件夾中全部的文件(不包括子目錄)

topdown --可選，爲 True，則優先遍歷 top 目錄，不然優先遍歷 top 的子目錄(默認爲開啓)。若是 topdown 參數爲 True，walk 會遍歷top文件夾，與top 文件夾中每個子目錄。

onerror -- 可選，須要一個 callable 對象，當 walk 須要異常時，會調用。

followlinks -- 可選，若是爲 True，則會遍歷目錄下的快捷方式(linux 下是 symbolic link)實際所指的目錄(默認關閉)。

import os
def get_files():
    for dirpath, dirs, files in os.walk(r"E:\wxorder", topdown=False):
        for name in files:
            print(os.path.join(dirpath, name))
            # print(os.path.join(name))
        # for name in dirs:
        #     print(os.path.join(dirpath, name))
get_files()

文件操做：
os.mknod("test.txt") 建立空文件
fp = open("test.txt",w) 直接打開一個文件，若是文件不存在則建立文件

關於open 模式：

w     以寫方式打開，
a     以追加模式打開 (從 EOF 開始, 必要時建立新文件)
r+     以讀寫模式打開
w+     以讀寫模式打開 (參見 w )
a+     以讀寫模式打開 (參見 a )
rb     以二進制讀模式打開
wb     以二進制寫模式打開 (參見 w )
ab     以二進制追加模式打開 (參見 a )
rb+    以二進制讀寫模式打開 (參見 r+ )
wb+    以二進制讀寫模式打開 (參見 w+ )
ab+    以二進制讀寫模式打開 (參見 a+ )

fp.read([size]) #size爲讀取的長度，以byte爲單位

fp.readline([size]) #讀一行，若是定義了size，有可能返回的只是一行的一部分

fp.readlines([size]) #把文件每一行做爲一個list的一個成員，並返回這個list。其實它的內部是經過循環調用readline()來實現的。若是提供size參數，size是表示讀取內容的總長，也就是說可能只讀到文件的一部分。

fp.write(str) #把str寫到文件中，write()並不會在str後加上一個換行符

fp.writelines(seq) #把seq的內容所有寫到文件中(多行一次性寫入)。這個函數也只是忠實地寫入，不會在每行後面加上任何東西。

fp.close() #關閉文件。python會在一個文件不用後自動關閉文件，不過這一功能沒有保證，最好仍是養成本身關閉的習慣。若是一個文件在關閉後還對其進行操做會產生ValueError

fp.flush() #把緩衝區的內容寫入硬盤

fp.fileno() #返回一個長整型的」文件標籤「

fp.isatty() #文件是不是一個終端設備文件（unix系統中的）

fp.tell() #返回文件操做標記的當前位置，以文件的開頭爲原點

fp.next() #返回下一行，並將文件操做標記位移到下一行。把一個file用於for … in file這樣的語句時，就是調用next()函數來實現遍歷的。

fp.seek(offset[,whence]) #將文件打操做標記移到offset的位置。這個offset通常是相對於文件的開頭來計算的，通常爲正數。但若是提供了whence參數就不必定了，whence能夠爲0表示從頭開始計算，1表示以當前位置爲原點計算。2表示以文件末尾爲原點進行計算。須要注意，若是文件以a或a+的模式打開，每次進行寫操做時，文件操做標記會自動返回到文件末尾。

fp.truncate([size]) #把文件裁成規定的大小，默認的是裁到當前文件操做標記的位置。若是size比文件的大小還要大，依據系統的不一樣多是不改變文件，也多是用0把文件補到相應的大小，也多是以一些隨機的內容加上去。

目錄操做：
os.mkdir("file")                   建立目錄
複製文件：
shutil.copyfile("oldfile","newfile")       oldfile和newfile都只能是文件
shutil.copy("oldfile","newfile")            oldfile只能是文件夾，newfile能夠是文件，也能夠是目標目錄
複製文件夾：
shutil.copytree("olddir","newdir")        olddir和newdir都只能是目錄，且newdir必須不存在
重命名文件（目錄）
os.rename("oldname","newname")       文件或目錄都是使用這條命令
移動文件（目錄）
shutil.move("oldpos","newpos")
刪除文件
os.remove("file")
刪除目錄
os.rmdir("dir")只能刪除空目錄
shutil.rmtree("dir")    空目錄、有內容的目錄均可以刪
轉換目錄
os.chdir("path")   換路徑

接下來咱們將實際運用一下部分命令的用法。

咱們試着打開一個文件以下：

In [1]: open('/tmp/tmp.txt')
Out[1]: <open file '/tmp/tmp.txt', mode 'r' at 0x1ba6150>

In [2]: fd=open('/tmp/tmp.txt')          #用一個參數fd接收一下

In [3]: type(fd)                         #能夠看到fd是文件類型
Out[3]: file

文件會有不少方法能夠使用，好比fd.close，打開一個文件也須要關閉它：

In [4]: fd.
fd.close       fd.flush       fd.next        fd.seek        fd.writelines
fd.closed      fd.isatty      fd.read        fd.softspace   fd.xreadlines
fd.encoding    fd.mode        fd.readinto    fd.tell        
fd.errors      fd.name        fd.readline    fd.truncate    
fd.fileno      fd.newlines    fd.readlines   fd.write       

In [5]: fd.close()         #關閉文件

而後咱們再已讀寫的方式打開以前那個文件：

In [6]: fd=open('/tmp/tmp.txt','w')          # 以讀寫的方式打開這個文件

In [7]: fd
Out[7]: <open file '/tmp/tmp.txt', mode 'w' at 0x1ba6270>

In [8]: fd.wri
fd.write       fd.writelines  

In [8]: fd.write("a")                        # 往文件裏面寫入一個a，在這個時候會覆蓋文件原有的內容

In [9]: fd.clo
fd.close   fd.closed  

In [9]: fd.close()                           # 接着咱們關閉這個文件

接着咱們以讀寫的方式寫入一個「123」，而後再往文件裏面追加一個「456」：

In [10]: fd=open('/tmp/tmp.txt','w')

In [11]: fd.write("123\n")

In [12]:

In [12]: fd.close()

In [13]:

In [13]: fd=open('/tmp/tmp.txt','a')

In [14]: fd.write("456\n")

In [15]: fd.close()

文件內容變化以下：

[root@izj6cdhdoq5a5z7lfkmaeaz ~]# cat /tmp/tmp.txt
123
[root@izj6cdhdoq5a5z7lfkmaeaz ~]#
[root@izj6cdhdoq5a5z7lfkmaeaz ~]# cat /tmp/tmp.txt
123
456

以只讀模式打開文件以下：

In [16]: fd=open('/tmp/tmp.txt','r')

In [17]: fd.read()                  
Out[17]: '123\n456\n'

In [18]: fd.read()        #由於讀取第二遍的時候是日後讀取的，後面沒有內容，全部返回的就是空的
Out[18]: ''

In [19]: fd.read()
Out[19]: ''

read方法的比較：

In [19]: fd.read()               # 返回的是一個字符串
Out[19]: ''

In [20]: fd.readline()           # 返回的是一個字符串
Out[20]: ''

In [21]: fd.readlines()          # 返回的是一個列表
Out[21]: []

咱們把打開一個文件的操做腳本寫入一個文件：

[root@izj6cdhdoq5a5z7lfkmaeaz ~]# cat openfile.py
#!/usr/local/python3/bin/python

fd=open("/tmp/tmp.txt")
for i in fd.readlines():
    print(i)
[root@izj6cdhdoq5a5z7lfkmaeaz ~]#
[root@izj6cdhdoq5a5z7lfkmaeaz ~]# python openfile.py
123

456

[root@izj6cdhdoq5a5z7lfkmaeaz ~]#

由上面咱們能夠看到打開文件內容默認會顯示空行，咱們去掉空行，以下所示：

[root@izj6cdhdoq5a5z7lfkmaeaz ~]# cat openfile.py       
#!/usr/local/python3/bin/python

fd=open("/tmp/tmp.txt")
for i in fd.readlines():
    print(i,end='')
[root@izj6cdhdoq5a5z7lfkmaeaz ~]#
[root@izj6cdhdoq5a5z7lfkmaeaz ~]#
[root@izj6cdhdoq5a5z7lfkmaeaz ~]#
[root@izj6cdhdoq5a5z7lfkmaeaz ~]# python openfile.py
123
456
[root@izj6cdhdoq5a5z7lfkmaeaz ~]#

咱們通常建議在實際讀取文件的時候去掉read方法，由於當文件很是大的時候，讀取出來將消耗很大一部分的內存，通常直接進行以下代碼便可：

[root@izj6cdhdoq5a5z7lfkmaeaz ~]# cat openfile.py   
#!/usr/local/python3/bin/python

fd=open("/tmp/tmp.txt")
for i in fd:                # 這樣遍歷的就是一個對象，對象會一行一行的取值讀出來
    print(i,end='')
[root@izj6cdhdoq5a5z7lfkmaeaz ~]#
[root@izj6cdhdoq5a5z7lfkmaeaz ~]#
[root@izj6cdhdoq5a5z7lfkmaeaz ~]# python openfile.py
123
456
[root@izj6cdhdoq5a5z7lfkmaeaz ~]#

咱們也能夠試着使用 while 打開一個文件，代碼以下：

[root@izj6cdhdoq5a5z7lfkmaeaz ~]# cat whileopenfile.py               
#!/usr/local/python3/bin/python

fd=open("/tmp/tmp.txt")
while True:
    line = fd.readline()
    if not line:
        break
    print(line,end='')
fd.close()
[root@izj6cdhdoq5a5z7lfkmaeaz ~]#
[root@izj6cdhdoq5a5z7lfkmaeaz ~]# python whileopenfile.py    
123
456
[root@izj6cdhdoq5a5z7lfkmaeaz ~]#

那麼怎樣使用with...open呢？with...open相較而言的好處在於無需close遍歷的文件：

[root@izj6cdhdoq5a5z7lfkmaeaz ~]# cat whileopenfile.py        
#!/usr/local/python3/bin/python

with open("/tmp/tmp.txt") as fd:
    while True:
        line = fd.readline()
        if not line:
            break
        print(line,end='')

[root@izj6cdhdoq5a5z7lfkmaeaz ~]#
[root@izj6cdhdoq5a5z7lfkmaeaz ~]# python whileopenfile.py     
123
456
[root@izj6cdhdoq5a5z7lfkmaeaz ~]#

參考資料：

1. https://www.cnblogs.com/rollenholt/archive/2012/04/23/2466179.html

2. http://www.runoob.com/python/os-walk.html