文件操做
計算機系統分爲:計算機硬件,操做系統,應用程序三部分。 咱們用python或其餘語言編寫的應用程序若想要把數據永久保存下來,必需要保存於硬盤中,這就涉及到應用程序要操做硬件,衆所周知,應用程序是沒法直接操做硬件的,這就用到了操做系統。操做系統把複雜的硬件操做封裝成簡單的接口給用戶/應用程序使用,其中文件就是操做系統提供給應用程序來操做硬盤虛擬概念,用戶或應用程序經過操做文件,能夠將本身的數據永久保存下來。有了文件的概念,咱們無需再去考慮操做硬盤的細節,只須要關注操做文件的流程:python
1、打開文件
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
|
"""
一、由應用程序向操做系統發起系統調用open(...)
二、操做系統打開該文件,並返回一個文件句柄給應用程序
三、應用程序將文件句柄賦值給變量f
文件句柄 = open('文件路徑', '模式','編碼')
"""
#1. 打開文件,獲得文件句柄並賦值給一個變量
f
=
open
(
'a.txt'
,
'r'
,encoding
=
'utf-8'
)
# 默認打開模式就爲r
#2. 經過句柄對文件進行操做
con
=
f.read()
print
(con)
#3. 關閉文件
f.close()
"""
注意:
一、回收操做系統級打開的文件f.close()
二、編碼
f=open(...)是由操做系統打開文件,若是沒爲open指定編碼,操做系統會用本身的默認編碼去打開文件,
在windows下是gbk,在linux下是utf-8
"""
#防止忘記不關閉文件推薦用with
with
open
(
'a.txt'
,
'a+'
,encoding
=
'utf-8'
) as f:
con
=
f.write(
'99999999'
)
print
(con)
|
2、打開模式
一、文本模式(默認)
- r,只讀模式【默認模式,文件必須存在,不存在則拋出異常】
- w,只寫模式【不可讀;不存在則建立;存在則清空內容】
- a,追加寫模式【不可讀;不存在則建立;存在則只追加內容】
二、字節模式(對於非文本文件,圖片,視頻,這種模式無需考慮文本文件的字符編碼)
- rb,只讀模式【默認模式,文件必須存在,不存在則拋出異常】
- wb,只寫模式【不可讀;不存在則建立;存在則清空內容】
- ab,追加寫模式【不可讀;不存在則建立;存在則只追加內容】
三、讀寫
- r+,讀寫【可讀,可寫】從文件開頭寫入
- w+,寫讀【可讀,可寫】清空後再寫
- a+,寫讀【可讀,可寫】從文件末尾寫入
3、操做方法
- f.read() #讀取全部內容,光標移動到文件末尾
- f.readline() #讀取一行內容,光標移動到第二行首部
- f.readlines() #讀取每一行內容,存放於列表中,返回一個list
- f.write('1111\n222\n') #針對文本模式的寫,須要本身寫換行符
- f.write('1111\n222\n'.encode('utf-8')) #針對b模式的寫,須要本身寫換行符
- f.writelines(['333\n','444\n']) #文件模式
- f.writelines([bytes('333\n',encoding='utf-8'),'444\n'.encode('utf-8')]) #b模式
- f.flush() #馬上將文件內容從內存刷到硬盤
- f.readable() #文件是否可讀
- f.writable() #文件是否可讀
- f.closed #文件是否關閉
- f.encoding #若是文件打開模式爲b,則沒有該屬性
4、光標操做
- f.tell() 讀取指針的位置
- f.seek(0) 設置指針的位置
- truncate是截斷文件,因此文件的打開方式必須可寫,可是不能用w或w+等方式打開,由於那樣直接清空文件了,因此truncate要在r+或a或a+等模式下測試效果
- read(3) 文件打開方式爲文本模式時,表明讀取3個字符,文件打開方式爲b模式時,表明讀取3個字節
- seek,tell,truncate光標移動都是以字節爲單位
- seek有三種移動方式0,1,2,其中1和2必須在b模式下進行,但不管哪一種模式,都是以bytes爲單位移動的
5、文件的修改
文件的數據是存放於硬盤上的,於是只存在覆蓋、不存在修改這麼一說,咱們平時看到的修改文件,都是模擬出來的效果linux
一、方式一
將硬盤存放的該文件的內容所有加載到內存,在內存中是能夠修改的,修改完畢後,再由內存覆蓋到硬盤(word,vim,nodpad++等編輯器)vim
1
2
3
4
5
6
7
8
|
import
os
with
open
(
'a.txt'
,
'r'
,encoding
=
'utf-8'
) as read_f,
open
(
'.a.txt.swap'
,
'w'
,encoding
=
'utf-8'
) as write_f:
data
=
read_f.read()
#所有讀入內存,若是文件很大,會很卡
data
=
data.replace(
'111'
,
'222'
)
#在內存中完成修改
write_f.write(data)
#一次性寫入新文件
os.remove(
'a.txt'
)
os.rename(
'.a.txt.swap'
,
'a.txt'
)
|
二、方式二【推薦】
將硬盤存放的該文件的內容一行一行地讀入內存,修改完畢就寫入新文件,最後用新文件覆蓋源文件windows
1
2
3
4
5
6
7
8
|
import
os
with
open
(
'a.txt'
,
'r'
,encoding
=
'utf-8'
) as read_f,
open
(
'.a.txt.swap'
,
'w'
,encoding
=
'utf-8'
) as write_f:
for
line
in
read_f:
line
=
line.replace(
'222'
,
'111'
)
write_f.write(line)
os.remove(
'a.txt'
)
os.rename(
'.a.txt.swap'
,
'a.txt'
)
|
6、字節模式
1
2
3
4
5
6
7
8
9
10
11
12
|
f
=
open
(
'a.txt'
,
'r'
,encoding
=
'utf8'
)
print
(f.read())
f.close()
f
=
open
(
'a.txt'
,
'rb'
)
print
(f.read().decode(
'utf8'
))
f.close()
f
=
open
(
'a.txt'
,
'w'
,encoding
=
'utf8'
)
print
(f.write(
'hello 合理'
))
f.close()
f
=
open
(
'a.txt'
,
'wb'
)
print
(f.write(
'hello 合理'
.encode(
'utf8'
)))
f.close()
|