【Python】Python讀寫文件操做

原帖地址:

http://blog.csdn.net/adupt/article/details/4435615python


1.open

使用open打開文件後必定要記得調用文件對象的close()方法。好比能夠用try/finally語句來確保最後能關閉文件。windows

file_object = open('thefile.txt')
try
:
     all_the_text 
=
 file_object.read( )
finally
:
     file_object.close( )
緩存


注:不能把open語句放在try塊裏,由於當打開文件出現異常時,文件對象file_object沒法執行close()方法。ide

2.讀文件

讀文本文件

input = open('data''r')
#第二個參數默認爲r

input = open('data')
函數

 

讀二進制文件

input = open('data''rb')性能

 

讀取全部內容

file_object = open('thefile.txt')
try
:
     all_the_text 
=
 file_object.read( )
finally
:
     file_object.close( )
編碼

 

讀固定字節

file_object = open('abinfile''rb')
try
:
    
while
 True:
         chunk 
= file_object.read(100
)
        
if not
 chunk:
            
break

         do_something_with(chunk)
finally:
     file_object.close( )
spa

 

讀每行

list_of_all_the_lines = file_object.readlines( ).net


若是文件是文本文件,還能夠直接遍歷文件對象獲取每行:unix

for line in file_object:
     process line

 

3.寫文件

寫文本文件

output = open('data''w')

 

寫二進制文件

output = open('data''wb')

 

追加寫文件

output = open('data''w+')

 

寫數據

file_object = open('thefile.txt''w')
file_object.write(all_the_text)
file_object.close( )

 

寫入多行

file_object.writelines(list_of_text_strings)


注意,調用writelines寫入多行在性能上會比使用write一次性寫入要高。

在處理日誌文件的時候,經常會遇到這樣的狀況:日誌文件巨大,不可能一次性把整個文件讀入到內存中進行處理,例如須要在一臺物理內存爲 2GB 的機器上處理一個 2GB 的日誌文件,咱們可能但願每次只處理其中 200MB 的內容。
在 Python 中,內置的 File 對象直接提供了一個 readlines(sizehint) 函數來完成這樣的事情。如下面的代碼爲例:

file = open('test.log', 'r')
sizehint
= 209715200   # 200M

position = 0
lines
=
file.readlines(sizehint)
while not file.tell() - position <
0:
       position
=
file.tell()
       lines
= file.readlines(sizehint)


每次調用 readlines(sizehint) 函數,會返回大約 200MB 的數據,並且所返回的必然都是完整的行數據,大多數狀況下,返回的數據的字節數會稍微比 sizehint 指定的值大一點(除最後一次調用 readlines(sizehint) 函數的時候)。一般狀況下,Python 會自動將用戶指定的 sizehint 的值調整成內部緩存大小的整數倍。

file在python是一個特殊的類型,它用於在python程序中對外部的文件進行操做。在python中一切都是對象,file也不例外,file有file的方法和屬性。下面先來看如何建立一個file對象:

  • file(name[, mode[, buffering]])

file()函數用於建立一個file對象,它有一個別名叫open(),可能更形象一些,它們是內置函數。來看看它的參數。它參數都是以字符串的形式傳遞的。name是文件的名字。
mode是打開的模式,可選的值爲r w a U,分別表明讀(默認) 寫 添加支持各類換行符的模式。用w或a模式打開文件的話,若是文件不存在,那麼就自動建立。此外,用w模式打開一個已經存在的文件時,原有文件的內容會被清空,由於一開始文件的操做的標記是在文件的開頭的,這時候進行寫操做,無疑會把原有的內容給抹掉。因爲歷史的緣由,換行符在不一樣的系統中有不一樣模式,好比在 unix中是一個/n,而在windows中是‘/r/n’,用U模式打開文件,就是支持全部的換行模式,也就說‘/r’ '/n' '/r/n'均可表示換行,會有一個tuple用來存貯這個文件中用到過的換行符。不過,雖然說換行有多種模式,讀到python中統一用/n代替。在模式字符的後面,還能夠加上+ b t這兩種標識,分別表示能夠對文件同時進行讀寫操做和用二進制模式、文本模式(默認)打開文件。
buffering若是爲0表示不進行緩衝;若是爲1表示進行「行緩衝「;若是是一個大於1的數表示緩衝區的大小,應該是以字節爲單位的。

file對象有本身的屬性和方法。先來看看file的屬性。

  • closed #標記文件是否已經關閉,由close()改寫

  • encoding #文件編碼

  • mode #打開模式

  • name #文件名

  • newlines #文件中用到的換行模式,是一個tuple

  • softspace #boolean型,通常爲0,聽說用於print


file的讀寫方法:

  • F.read([size]) #size爲讀取的長度,以byte爲單位

  • F.readline([size]) 
    #讀一行,若是定義了size,有可能返回的只是一行的一部分

  • F.readlines([size]) 
    #把文件每一行做爲一個list的一個成員,並返回這個list。其實它的內部是經過循環調用readline()來實現的。若是提供size參數,size是表示讀取內容的總長,也就是說可能只讀到文件的一部分。

  • F.write(str) 
    #把str寫到文件中,write()並不會在str後加上一個換行符

  • F.writelines(seq) 
    #把seq的內容所有寫到文件中。這個函數也只是忠實地寫入,不會在每行後面加上任何東西。

file的其餘方法:

  • F.close() 
    #關閉文件。python會在一個文件不用後自動關閉文件,不過這一功能沒有保證,最好仍是養成本身關閉的習慣。若是一個文件在關閉後還對其進行操做會產生ValueError

  • F.flush() 
    #把緩衝區的內容寫入硬盤

  • F.fileno() 
    #返回一個長整型的」文件標籤「

  • F.isatty() 
    #文件是不是一個終端設備文件(unix系統中的)

  • F.tell() 
    #返回文件操做標記的當前位置,以文件的開頭爲原點

  • F.next() 
    #返回下一行,並將文件操做標記位移到下一行。把一個file用於for ... in file這樣的語句時,就是調用next()函數來實現遍歷的。

  • F.seek(offset[,whence]) 
    #將文件打操做標記移到offset的位置。這個offset通常是相對於文件的開頭來計算的,通常爲正數。但若是提供了whence參數就不必定了,whence能夠爲0表示從頭開始計算,1表示以當前位置爲原點計算。2表示以文件末尾爲原點進行計算。須要注意,若是文件以a或a+的模式打開,每次進行寫操做時,文件操做標記會自動返回到文件末尾。

  • F.truncate([size]) #把文件裁成規定的大小,默認的是裁到當前文件操做標記的位置。若是size比文件的大小還要大,依據系統的不一樣多是不改變文件,也多是用0把文件補到相應的大小,也多是以一些隨機的內容加上去。

相關文章
相關標籤/搜索