Python的文件操做

python中對文件、文件夾(文件操做函數)的操做須要涉及到os模塊和shutil模塊。html

獲得當前工做目錄,即當前Python腳本工做的目錄路徑: os.getcwd()python

返回指定目錄下的全部文件和目錄名:os.listdir()linux

函數用來刪除一個文件:os.remove()shell

刪除多個目錄:os.removedirs(r「c:\python」)函數

檢驗給出的路徑是不是一個文件:os.path.isfile()oop

檢驗給出的路徑是不是一個目錄:os.path.isdir()spa

判斷是不是絕對路徑:os.path.isabs()unix

檢驗給出的路徑是否真地存:os.path.exists()code

返回一個路徑的目錄名和文件名:os.path.split()    htm

eg os.path.split('/home/swaroop/byte/code/poem.txt')

結果:('/home/swaroop/byte/code', 'poem.txt') 

分離擴展名:os.path.splitext()

獲取路徑名:os.path.dirname()

獲取文件名:os.path.basename()

運行shell命令: os.system()

讀取和設置環境變量:os.getenv() 與os.putenv()

給出當前平臺使用的行終止符:os.linesep    Windows使用'\r\n',Linux使用'\n'而Mac使用'\r'

指示你正在使用的平臺:os.name       對於Windows,它是'nt',而對於Linux/Unix用戶,它是'posix'

重命名:os.rename(old, new)

建立多級目錄:os.makedirs(r「c:\python\test」)

建立單個目錄:os.mkdir(「test」)

獲取文件屬性:os.stat(file)

修改文件權限與時間戳:os.chmod(file)

終止當前進程:os.exit()

獲取文件大小:os.path.getsize(filename)

 

 今天在嘗試寫一個腳本遍歷目錄下以及子目錄下的全部文件時,有用到 walk()方法,其語法格式如:

os.walk(top[, topdown=True[, onerror=None[, followlinks=False]]])

top -- 是你所要便歷的目錄的地址, 返回的是一個三元組(root,dirs,files)。

    root 所指的是當前正在遍歷的這個文件夾的自己的地址

    dirs 是一個 list ,內容是該文件夾中全部的目錄的名字(不包括子目錄)

    files 一樣是 list , 內容是該文件夾中全部的文件(不包括子目錄)

topdown --可選,爲 True,則優先遍歷 top 目錄,不然優先遍歷 top 的子目錄(默認爲開啓)。若是 topdown 參數爲 True,walk 會遍歷top文件夾,與top 文件夾中每個子目錄。

onerror -- 可選, 須要一個 callable 對象,當 walk 須要異常時,會調用。

followlinks -- 可選, 若是爲 True,則會遍歷目錄下的快捷方式(linux 下是 symbolic link)實際所指的目錄(默認關閉)。

import os
def get_files():
    for dirpath, dirs, files in os.walk(r"E:\wxorder", topdown=False):
        for name in files:
            print(os.path.join(dirpath, name))
            # print(os.path.join(name))
        # for name in dirs:
        #     print(os.path.join(dirpath, name))
get_files()

 

文件操做:
os.mknod("test.txt")        建立空文件
fp = open("test.txt",w)     直接打開一個文件,若是文件不存在則建立文件

關於open 模式:

w     以寫方式打開,
a     以追加模式打開 (從 EOF 開始, 必要時建立新文件)
r+     以讀寫模式打開
w+     以讀寫模式打開 (參見 w )
a+     以讀寫模式打開 (參見 a )
rb     以二進制讀模式打開
wb     以二進制寫模式打開 (參見 w )
ab     以二進制追加模式打開 (參見 a )
rb+    以二進制讀寫模式打開 (參見 r+ )
wb+    以二進制讀寫模式打開 (參見 w+ )
ab+    以二進制讀寫模式打開 (參見 a+ )

fp.read([size])                     #size爲讀取的長度,以byte爲單位

fp.readline([size])                 #讀一行,若是定義了size,有可能返回的只是一行的一部分

fp.readlines([size])                #把文件每一行做爲一個list的一個成員,並返回這個list。其實它的內部是經過循環調用readline()來實現的。若是提供size參數,size是表示讀取內容的總長,也就是說可能只讀到文件的一部分。

fp.write(str)                      #把str寫到文件中,write()並不會在str後加上一個換行符

fp.writelines(seq)            #把seq的內容所有寫到文件中(多行一次性寫入)。這個函數也只是忠實地寫入,不會在每行後面加上任何東西。

fp.close()                        #關閉文件。python會在一個文件不用後自動關閉文件,不過這一功能沒有保證,最好仍是養成本身關閉的習慣。  若是一個文件在關閉後還對其進行操做會產生ValueError

fp.flush()                                      #把緩衝區的內容寫入硬盤

fp.fileno()                                      #返回一個長整型的」文件標籤「

fp.isatty()                                      #文件是不是一個終端設備文件(unix系統中的)

fp.tell()                                         #返回文件操做標記的當前位置,以文件的開頭爲原點

fp.next()                                       #返回下一行,並將文件操做標記位移到下一行。把一個file用於for … in file這樣的語句時,就是調用next()函數來實現遍歷的。

fp.seek(offset[,whence])              #將文件打操做標記移到offset的位置。這個offset通常是相對於文件的開頭來計算的,通常爲正數。但若是提供了whence參數就不必定了,whence能夠爲0表示從頭開始計算,1表示以當前位置爲原點計算。2表示以文件末尾爲原點進行計算。須要注意,若是文件以a或a+的模式打開,每次進行寫操做時,文件操做標記會自動返回到文件末尾。

fp.truncate([size])                       #把文件裁成規定的大小,默認的是裁到當前文件操做標記的位置。若是size比文件的大小還要大,依據系統的不一樣多是不改變文件,也多是用0把文件補到相應的大小,也多是以一些隨機的內容加上去。

 

目錄操做:
os.mkdir("file")                   建立目錄
複製文件:
shutil.copyfile("oldfile","newfile")       oldfile和newfile都只能是文件
shutil.copy("oldfile","newfile")            oldfile只能是文件夾,newfile能夠是文件,也能夠是目標目錄
複製文件夾:
shutil.copytree("olddir","newdir")        olddir和newdir都只能是目錄,且newdir必須不存在
重命名文件(目錄)
os.rename("oldname","newname")       文件或目錄都是使用這條命令
移動文件(目錄)
shutil.move("oldpos","newpos")   
刪除文件
os.remove("file")
刪除目錄
os.rmdir("dir")只能刪除空目錄
shutil.rmtree("dir")    空目錄、有內容的目錄均可以刪
轉換目錄
os.chdir("path")   換路徑

 

接下來咱們將實際運用一下部分命令的用法 。

咱們試着打開一個文件以下:

In [1]: open('/tmp/tmp.txt')
Out[1]: <open file '/tmp/tmp.txt', mode 'r' at 0x1ba6150>

In [2]: fd=open('/tmp/tmp.txt')          #用一個參數fd接收一下

In [3]: type(fd)                         #能夠看到fd是文件類型
Out[3]: file

文件會有不少方法能夠使用,好比fd.close,打開一個文件也須要關閉它:

In [4]: fd.
fd.close       fd.flush       fd.next        fd.seek        fd.writelines
fd.closed      fd.isatty      fd.read        fd.softspace   fd.xreadlines
fd.encoding    fd.mode        fd.readinto    fd.tell        
fd.errors      fd.name        fd.readline    fd.truncate    
fd.fileno      fd.newlines    fd.readlines   fd.write       

In [5]: fd.close()         #關閉文件

而後咱們再已讀寫的方式打開以前那個文件:

In [6]: fd=open('/tmp/tmp.txt','w')          # 以讀寫的方式打開這個文件

In [7]: fd
Out[7]: <open file '/tmp/tmp.txt', mode 'w' at 0x1ba6270>

In [8]: fd.wri
fd.write       fd.writelines  

In [8]: fd.write("a")                        # 往文件裏面寫入一個a,在這個時候會覆蓋文件原有的內容

In [9]: fd.clo
fd.close   fd.closed  

In [9]: fd.close()                           # 接着咱們關閉這個文件

接着咱們以讀寫的方式寫入一個「123」,而後再往文件裏面追加一個「456」:

In [10]: fd=open('/tmp/tmp.txt','w')

In [11]: fd.write("123\n")

In [12]:

In [12]: fd.close()

In [13]:

In [13]: fd=open('/tmp/tmp.txt','a')

In [14]: fd.write("456\n")

In [15]: fd.close()

文件內容變化以下:

[root@izj6cdhdoq5a5z7lfkmaeaz ~]# cat /tmp/tmp.txt
123
[root@izj6cdhdoq5a5z7lfkmaeaz ~]#
[root@izj6cdhdoq5a5z7lfkmaeaz ~]# cat /tmp/tmp.txt
123
456

以只讀模式打開文件以下:

In [16]: fd=open('/tmp/tmp.txt','r')

In [17]: fd.read()                  
Out[17]: '123\n456\n'

In [18]: fd.read()        #由於讀取第二遍的時候是日後讀取的,後面沒有內容,全部返回的就是空的
Out[18]: ''

In [19]: fd.read()
Out[19]: ''

read方法的比較:

In [19]: fd.read()               # 返回的是一個字符串
Out[19]: ''

In [20]: fd.readline()           # 返回的是一個字符串
Out[20]: ''

In [21]: fd.readlines()          # 返回的是一個列表
Out[21]: []

咱們把打開一個文件的操做腳本寫入一個文件:

[root@izj6cdhdoq5a5z7lfkmaeaz ~]# cat openfile.py
#!/usr/local/python3/bin/python

fd=open("/tmp/tmp.txt")
for i in fd.readlines():
    print(i)
[root@izj6cdhdoq5a5z7lfkmaeaz ~]#
[root@izj6cdhdoq5a5z7lfkmaeaz ~]# python openfile.py
123

456

[root@izj6cdhdoq5a5z7lfkmaeaz ~]#

由上面咱們能夠看到打開文件內容默認會顯示空行,咱們去掉空行,以下所示:

[root@izj6cdhdoq5a5z7lfkmaeaz ~]# cat openfile.py       
#!/usr/local/python3/bin/python

fd=open("/tmp/tmp.txt")
for i in fd.readlines():
    print(i,end='')
[root@izj6cdhdoq5a5z7lfkmaeaz ~]#
[root@izj6cdhdoq5a5z7lfkmaeaz ~]#
[root@izj6cdhdoq5a5z7lfkmaeaz ~]#
[root@izj6cdhdoq5a5z7lfkmaeaz ~]# python openfile.py
123
456
[root@izj6cdhdoq5a5z7lfkmaeaz ~]#

咱們通常建議在實際讀取文件的時候去掉read方法,由於當文件很是大的時候,讀取出來將消耗很大一部分的內存,通常直接進行以下代碼便可:

[root@izj6cdhdoq5a5z7lfkmaeaz ~]# cat openfile.py   
#!/usr/local/python3/bin/python

fd=open("/tmp/tmp.txt")
for i in fd:                # 這樣遍歷的就是一個對象,對象會一行一行的取值讀出來
    print(i,end='')
[root@izj6cdhdoq5a5z7lfkmaeaz ~]#
[root@izj6cdhdoq5a5z7lfkmaeaz ~]#
[root@izj6cdhdoq5a5z7lfkmaeaz ~]# python openfile.py
123
456
[root@izj6cdhdoq5a5z7lfkmaeaz ~]#

咱們也能夠試着使用 while 打開一個文件,代碼以下:

[root@izj6cdhdoq5a5z7lfkmaeaz ~]# cat whileopenfile.py               
#!/usr/local/python3/bin/python

fd=open("/tmp/tmp.txt")
while True:
    line = fd.readline()
    if not line:
        break
    print(line,end='')
fd.close()
[root@izj6cdhdoq5a5z7lfkmaeaz ~]#
[root@izj6cdhdoq5a5z7lfkmaeaz ~]# python whileopenfile.py    
123
456
[root@izj6cdhdoq5a5z7lfkmaeaz ~]#

那麼怎樣使用with...open呢?with...open相較而言的好處在於無需close遍歷的文件:

[root@izj6cdhdoq5a5z7lfkmaeaz ~]# cat whileopenfile.py        
#!/usr/local/python3/bin/python

with open("/tmp/tmp.txt") as fd:
    while True:
        line = fd.readline()
        if not line:
            break
        print(line,end='')

[root@izj6cdhdoq5a5z7lfkmaeaz ~]#
[root@izj6cdhdoq5a5z7lfkmaeaz ~]# python whileopenfile.py     
123
456
[root@izj6cdhdoq5a5z7lfkmaeaz ~]#

 

 

 

參考資料:

1. https://www.cnblogs.com/rollenholt/archive/2012/04/23/2466179.html

2. http://www.runoob.com/python/os-walk.html

相關文章
相關標籤/搜索