轉自:http://www.nnzhp.cn/article/16/ python
這篇博客來講一下python對文件的操做。linux
對文件的操做分三步:windows
一、打開文件獲取文件的句柄,句柄就理解爲這個文件性能
二、經過文件句柄操做文件學習
三、關閉文件。測試
現有如下文件file.txt: 編碼
寂寞固然有一點
你不在我身邊
老是特別想念你的臉
距離是一份考卷
測量相愛的誓言
最後會不會實現
咱們爲愛還在學
學溝通的語言
學着諒解
學着不流淚
等到咱們學會飛
飛越黑夜和考驗
日子就要從孤單裏畢業
咱們用多一點點的辛苦
來交換多一點點的幸福
就算幸福
還有一段路
等咱們學會忍耐和付出
這愛情必定會有張證書
證實
今後不孤獨
今後不孤獨
文件基本操做:spa
f = open('file.txt','r') #以只讀方式打開一個文件,獲取文件句柄,若是是讀的話,r能夠不寫,默認就是隻讀,
在python2中還有file方法能夠打開文件,python3中file方法已經沒有了,只有open
frist_line = f.readline()#獲取文件的第一行內容,返回的是一個list
print(frist_line)#打印第一行
res = f.read()#獲取除了第一行剩下的全部文件內容
print(res)
f.close()#關閉文件
打開文件時,須要指定文件路徑和以何等方式打開文件,打開後,便可獲取該文件句柄,後面經過此文件句柄對該文件操做,指針
打開文件的模式有:接口
r,只讀模式(默認)。
w,只寫模式。【不可讀;不存在則建立;存在則刪除內容;】
a,追加模式。【不可讀; 不存在則建立;存在則只追加內容;】
"+" 表示能夠同時讀寫某個文件
r+,【可讀、可寫;可追加,若是打開的文件不存在的話,會報錯】
w+,【寫讀模式,使用w+的話,已經存在的文件內容會被清空,能夠讀到已經寫的文件內容】
a+,【追加讀寫模式,不存在則建立;存在則只追加內容;】
"U"表示在讀取時,能夠將 \r \n \r\n自動轉換成 \n (與 r 或 r+ 模式同使用)
rU
r+U
"b"表示處理二進制文件(如:FTP發送上傳ISO鏡像文件,linux可忽略,windows處理二進制文件時需標註)
rb
wb
ab
文件操做方法:
f = open('file.txt','r+',encoding='utf-8')#encoding參數能夠指定文件的編碼
f.readline()#讀一行
f.readable()#判斷文件是否可讀
fr.writable()#判斷文件是否可寫
fr.encoding#打印文件的編碼
f.read()#讀取全部內容,大文件時不要用,由於會把文件內容都讀到內存中,內存不夠的話,會把內存撐爆
f.readlines()#讀取全部文件內容,返回一個list,元素是每行的數據,大文件時不要用,由於會把文件內容都讀到內存中,內存不夠的話,會把內存撐爆
f.tell()#獲取當前文件的指針指向
f.seek(0)#把當前文件指針指向哪
f.write('愛情證書')#寫入內容
f.fulsh()#寫入文件後,當即從內存中把數據寫到磁盤中
f.truncate()#清空文件內容
f.writelines(['愛情證書','孫燕姿'])#將一個列表寫入文件中
f.close()關閉文件
大文件時,讀取文件高效的操做方法:
用上面的read()和readlines()方法操做文件的話,會先把文件全部內容讀到內存中,這樣的話,內存數據一多,很是卡,高效的操做,就是讀一行操做一行,讀過的內容就從內存中釋放了
f = open('file.txt')
for line in f:
print(line)
這樣的話,line就是每行文件的內容,讀完一行的話,就會釋放一行的內存
with使用:
在操做文件的時候,常常忘了關閉文件,這樣的就可使用with,它會在使用完這個文件句柄以後,自動關閉該文件,使用方式以下:
with open('file.txt','r') as f:#打開一個文件,把這個文件的句柄付給f
for line in f:
print(line)
with open('file.txt') as fr,with open('file_bak','w') as fw: #這個是多文件的操做,打開兩個文件,fr是讀file.txt,fw是新建一個file_bak文件
for line in fr:#循環file.txt中的每一行
fw.write(line)#寫到file_bak文件中
修改文件:
修改文件的話,有兩種方式,一種是把文件的所有內容都讀到內存中,而後把原有的文件內容清空,從新寫新的內容;第二種是把修改後的文件內容寫到一個新的文件中
第一種
with open('file.txt','r+') as fr:
res = fr.read()
new_res = res.replace('我','me')
fr.write(new_res)
第二種
with open('file.txt') as fr,with open('file_new','w') as fw: #這個是多文件的操做,打開兩個文件,fr是讀file.txt,fw是新建一個file_bak文件
for line in fr:#循環file.txt中的每一行
new_line = line.replace('我','me')
fw.write(new_line)#寫到file_bak文件中
集合:
集合也是一種數據類型,一個相似列表東西,它的特色是無序的,不重複的,也就是說集合中是沒有重複的數據
集合的做用:
一、它能夠把一個列表中重複的數據去掉,而不須要你再寫判斷
二、能夠作關係測試,好比說有兩個班,一個性能測試班,一個是接口測試班的,想找出來既學習了性能又學習了接口測試的同窗,就能夠用集合
定義集合
list = [2,3,1,2,3,4] s_list = set(list)#這樣就定義了一個集合 set1 = set([1,3,4,5,6])#這種方式和上面的都是把list轉換成一個集合 set2={'hehe','hehe1','hehe3'}#這種方式是直接定義一個集合
集合操做
list1 = {1, 2, 3, 4, 5, 6, 9} list2 = {2, 3, 4, 6, 1} list3 = {1, 2, 3} print(list1.intersection(list2)) # 取交集,也就是取list1和list2中都有的 print(list1 & list2)# 取交集 print(list1.union(list2)) # 取並集,也就是把list1和list2合併了,而後去除重複的 print(list1 | list2)# 取並集 print(list1.difference(list2)) #取差集 在list中存在,在list2中沒有的 print(list1 - list2) print(list3.issubset(list1))#判斷list3是否是list1的子集 print(list1.issuperset(list3))#判斷list1是否是list3的父集 print(list1.isdisjoint(list3))#判斷list1和list3是否有交集 print(list1.symmetric_difference(list2))#對稱差集,輸出兩個列表中都沒有的值,也就是把兩個集合中相同的去掉 print(list1 ^ list2) list1.add(888)#添加元素 list1.update([777,666,666]) list1.remove(777)#刪除元素,若是元素不存在會報錯 list1.pop()#刪除一個隨機的元素,並返回刪除的元素 list1.discard('dddd')#若是刪除的元素存在,刪除,不存在不作處理