1.經常使用內置函數:(不用import就能夠直接使用) python
help(obj) 在線幫助, obj但是任何類型正則表達式
callable(obj) 查看一個obj是否是能夠像函數同樣調用sql
repr(obj) 獲得obj的表示字符串,能夠利用這個字符串eval重建該對象的一個拷貝shell
eval_r(str) 表示合法的python表達式,返回這個表達式express
dir(obj) 查看obj的name space中可見的namewindows
hasattr(obj,name) 查看一個obj的name space中是否有name緩存
getattr(obj,name) 獲得一個obj的name space中的一個name函數
setattr(obj,name,value) 爲一個obj的name space中的一個name指向vale這個objectui
delattr(obj,name) 從obj的name space中刪除一個namespa
vars(obj) 返回一個object的name space。用dictionary表示
locals() 返回一個局部name space,用dictionary表示
globals() 返回一個全局name space,用dictionary表示
type(obj) 查看一個obj的類型
isinstance(obj,cls) 查看obj是否是cls的instance
issubclass(subcls,supcls) 查看subcls是否是supcls的子類
類型轉換函數
chr(i) 把一個ASCII數值,變成字符
ord(i) 把一個字符或者unicode字符,變成ASCII數值
oct(x) 把整數x變成八進制表示的字符串
hex(x) 把整數x變成十六進制表示的字符串
str(obj) 獲得obj的字符串描述
list(seq) 把一個sequence轉換成一個list
tuple(seq) 把一個sequence轉換成一個tuple
dict(),dict(list) 轉換成一個dictionary
int(x) 轉換成一個integer
long(x) 轉換成一個long interger
float(x) 轉換成一個浮點數
complex(x) 轉換成複數
max(...) 求最大值
min(...) 求最小值
用於執行程序的內置函數
complie 若是一段代碼常常要使用,那麼先編譯,再運行會更快。
2.和操做系統相關的調用
系統相關的信息模塊 import sys
sys.argv是一個list,包含全部的命令行參數.
sys.stdout sys.stdin sys.stderr 分別表示標準輸入輸出,錯誤輸出的文件對象.
sys.stdin.readline() 從標準輸入讀一行 sys.stdout.write("a") 屏幕輸出a
sys.exit(exit_code) 退出程序
sys.modules 是一個dictionary,表示系統中全部可用的module
sys.platform 獲得運行的操做系統環境
sys.path 是一個list,指明全部查找module,package的路徑.
操做系統相關的調用和操做 import os
os.environ 一個dictionary 包含環境變量的映射關係 os.environ["HOME"] 能夠獲得環境變量HOME的值
os.chdir(dir) 改變當前目錄 os.chdir('d:\\outlook') 注意windows下用到轉義
os.getcwd() 獲得當前目錄
os.getegid() 獲得有效組id os.getgid() 獲得組id
os.getuid() 獲得用戶id os.geteuid() 獲得有效用戶id
os.setegid os.setegid() os.seteuid() os.setuid()
os.getgruops() 獲得用戶組名稱列表
os.getlogin() 獲得用戶登陸名稱
os.getenv 獲得環境變量
os.putenv 設置環境變量
os.umask 設置umask
os.system(cmd) 利用系統調用,運行cmd命令
操做舉例:
os.mkdir('/tmp/xx') os.system("echo 'hello' > /tmp/xx/a.txt") os.listdir('/tmp/xx')
os.rename('/tmp/xx/a.txt','/tmp/xx/b.txt') os.remove('/tmp/xx/b.txt') os.rmdir('/tmp/xx')
用python編寫一個簡單的shell
#!/usr/bin/python
import os, sys
cmd = sys.stdin.readline()
while cmd:
os.system(cmd)
cmd = sys.stdin.readline()
用os.path編寫平臺無關的程序
os.path.abspath("1.txt") == os.path.join(os.getcwd(), "1.txt")
os.path.split(os.getcwd()) 用於分開一個目錄名稱中的目錄部分和文件名稱部分。
os.path.join(os.getcwd(), os.pardir, 'a', 'a.doc') 全成路徑名稱.
os.pardir 表示當前平臺下上一級目錄的字符 ..
os.path.getctime("/root/1.txt") 返回1.txt的ctime(建立時間)時間戳
os.path.exists(os.getcwd()) 判斷文件是否存在
os.path.expanduser('~/dir') 把~擴展成用戶根目錄
os.path.expandvars('$PATH') 擴展環境變量PATH
os.path.isfile(os.getcwd()) 判斷是不是文件名,1是0否
os.path.isdir('c:\Python26\temp') 判斷是不是目錄,1是0否
os.path.islink('/home/huaying/111.sql') 是不是符號鏈接 windows下不可用
os.path.ismout(os.getcwd()) 是不是文件系統安裝點 windows下不可用
os.path.samefile(os.getcwd(), '/home/huaying') 看看兩個文件名是否是指的是同一個文件
os.path.walk('/home/huaying', test_fun, "a.c")
遍歷/home/huaying下全部子目錄包括本目錄,對於每一個目錄都會調用函數test_fun.
例:在某個目錄中,和他全部的子目錄中查找名稱是a.c的文件或目錄。
def test_fun(filename, dirname, names): //filename便是walk中的a.c dirname是訪問的目錄名稱
if filename in names: //names是一個list,包含dirname目錄下的全部內容
print os.path.join(dirname, filename)
os.path.walk('/home/huaying', test_fun, "a.c")
文件操做
打開文件
f = open("filename", "r") r只讀 w寫 rw讀寫 rb讀二進制 wb寫二進制 w+寫追加
讀寫文件
f.write("a") f.write(str) 寫一字符串 f.writeline() f.readlines() 與下read類同
f.read() 全讀出來 f.read(size) 表示從文件中讀取size個字符
f.readline() 讀一行,到文件結尾,返回空串. f.readlines() 讀取所有,返回一個list. list每一個元素表示一行,包含"\n"\
f.tell() 返回當前文件讀取位置
f.seek(off, where) 定位文件讀寫位置. off表示偏移量,正數向文件尾移動,負數表示向開頭移動。
where爲0表示從開始算起,1表示從當前位置算,2表示從結尾算.
f.flush() 刷新緩存
關閉文件
f.close()
regular expression 正則表達式 import re
簡單的regexp
p = re.compile("abc") if p.match("abc") : print "match"
上例中首先生成一個pattern(模式),若是和某個字符串匹配,就返回一個match object
除某些特殊字符metacharacter元字符,大多數字符都和自身匹配。
這些特殊字符是 。^ $ * + ? { [ ] \ | ( )
字符集合(用[]表示)
列出字符,如[abc]表示匹配a或b或c,大多數metacharacter在[]中只表示和自己匹配。例:
a = ".^$*+?{\\|()" 大多數metachar在[]中都和自己匹配,但"^[]\"不一樣
p = re.compile("["+a+"]")
for i in a:
if p.match(i):
print "[%s] is match" %i
else:
print "[%s] is not match" %i
在[]中包含[]自己,表示"["或者"]"匹配.用\[和\]表示.
^出如今[]的開頭,表示取反.[^abc]表示除了a,b,c以外的全部字符。^沒有出如今開頭,即於身身匹配。
-可表示範圍.[a-zA-Z]匹配任何一個英文字母。[0-9]匹配任何數字。
\在[]中的妙用。
\d [0-9]
\D [^0-9]
\s [ \t\n\r\f\v]
\S [^ \t\n\r\f\v]
\w [a-zA-Z0-9_]
\W [^a-zA-Z0-9_]
\t 表示和tab匹配, 其餘的都和字符串的表示法一致
\x20 表示和十六進制ascii 0x20匹配
有了\,能夠在[]中表示任何字符。注:單獨的一個"."若是沒有出現[]中,表示出了換行\n之外的匹配任何字符,相似[^\n].
regexp的重複
{m,n}表示出現m個以上(含m個),n個如下(含n個). 如ab{1,3}c和abc,abbc,abbbc匹配,不會與ac,abbbc匹配。
m是下界,n是上界。m省略表下界是0,n省略,表上界無限大。
*表示{,} +表示{1,} ?表示{0,1}
最大匹配和最小匹配 python都是最大匹配,若是要最小匹配,在*,+,?,{m,n}後面加一個?.
match object的end能夠獲得匹配的最後一個字符的位置。
re.compile("a*").match('aaaa').end() 4 最大匹配
re.compile("a*?").match('aaaa').end() 0 最小匹配
使用原始字符串
字符串表示方法中用\\表示字符\.大量使用影響可讀性。
解決方法:在字符串前面加一個r表示raw格式。
a = r"\a" print a 結果是\a
a = r"\"a" print a 結果是\"a
使用re模塊
先用re.compile獲得一個RegexObject 表示一個regexp
後用pattern的match,search的方法,獲得MatchObject
再用match object獲得匹配的位置,匹配的字符串等信息
RegxObject經常使用函數:
>>> re.compile("a").match("abab") 若是abab的開頭和re.compile("a")匹配,獲得MatchObject
<_sre.SRE_Match object at 0x81d43c8>
>>> print re.compile("a").match("bbab")
None 注:從str的開頭開始匹配
>>> re.compile("a").search("abab") 在abab中搜索第一個和re_obj匹配的部分
<_sre.SRE_Match object at 0x81d43c8>
>>> print re.compile("a").search("bbab")
<_sre.SRE_Match object at 0x8184e18> 和match()不一樣,沒必要從開頭匹配
re_obj.findall(str) 返回str中搜索全部和re_obj匹配的部分.
返回一個tuple,其中元素是匹配的字符串.
MatchObject的經常使用函數
m.start() 返回起始位置,m.end()返回結束位置(不包含該位置的字符).
m.span() 返回一個tuple表示(m.start(), m.end())
m.pos(), m.endpos(), m.re(), m.string()
m.re().search(m.string(), m.pos(), m.endpos()) 會獲得m自己
m.finditer()能夠返回一個iterator,用來遍歷全部找到的MatchObject.
for m in re.compile("[ab]").finditer("tatbxaxb"):
print m.span()
高級regexp
| 表示聯合多個regexp. A B兩個regexp,A|B表示和A匹配或者跟B匹配.
^ 表示只匹配一行的開始行首,^只有在開頭纔有此特殊意義。
$ 表示只匹配一行的結尾
\A 表示只匹配第一行字符串的開頭 ^匹配每一行的行首
\Z 表示只匹配行一行字符串的結尾 $匹配第一行的行尾
\b 只匹配詞的邊界 例:\binfo\b 只會匹配"info" 不會匹配information
\B 表示匹配非單詞邊界
示例以下:
>>> print re.compile(r"\binfo\b").match("info ") #使用raw格式 \b表示單詞邊界
<_sre.SRE_Match object at 0x817aa98>
>>> print re.compile("\binfo\b").match("info ") #沒有使用raw \b表示退格符號
None
>>> print re.compile("\binfo\b").match("\binfo\b ")
<_sre.SRE_Match object at 0x8174948>
分組(Group) 示例:re.compile("(a(b)c)d").match("abcd").groups() ('abc', 'b')
#!/usr/local/bin/python
import re
x = """
name: Charles
Address: BUPT
name: Ann
Address: BUPT
"""
#p = re.compile(r"^name:(.*)\n^Address:(.*)\n", re.M)
p = re.compile(r"^name:(?P<name>.*)\n^Address:(?P<address>.*)\n", re.M)
for m in p.finditer(x):
print m.span()
print "here is your friends list"
print "%s, %s"%m.groups()
Compile Flag
用re.compile獲得RegxObject時,能夠有一些flag用來調整RegxObject的詳細特徵.
DOTALL, S 讓.匹配任意字符,包括換行符\n
IGNORECASE, I 忽略大小寫
LOCALES, L 讓\w \W \b \B和當前的locale一致
MULTILINE, M 多行模式,隻影響^和$(參見上例)
VERBOSE, X verbose模式