目錄python
標籤: Python stdout 重定向安全
本文基於Python2.7版本,介紹常見的幾種標準輸出(stdout)重定向方式。顯然,這些方式也適用於標準錯誤重定向。
本文同時也發佈於做業部落,視覺效果略有不一樣。bash
在Python中,文件對象sys.stdin
、sys.stdout
和sys.stderr
分別對應解釋器的標準輸入、標準輸出和標準出錯流。在程序啓動時,這些對象的初值由sys.__stdin__
、sys.__stdout__
和sys.__stderr__
保存,以便用於收尾(finalization)時恢復標準流對象。網絡
Windows系統中IDLE(Python GUI)由pythonw.exe,該GUI沒有控制檯。所以,IDLE將標準輸出句柄替換爲特殊的PseudoOutputFile對象,以便腳本輸出重定向到IDLE終端窗口(Shell)。這可能致使一些奇怪的問題,例如:app
Python 2.7.11 (v2.7.11:6d1b6a68f775, Dec 5 2015, 20:32:19) [MSC v.1500 32 bit (Intel)] on win32 Type "copyright", "credits" or "license()" for more information. >>> import sys >>> for fd in (sys.stdin, sys.stdout, sys.stderr): print fd <idlelib.PyShell.PseudoInputFile object at 0x0177C910> <idlelib.PyShell.PseudoOutputFile object at 0x0177C970> <idlelib.PyShell.PseudoOutputFile object at 0x017852B0> >>> for fd in (sys.__stdin__, sys.__stdout__, sys.__stderr__): print fd <open file '<stdin>', mode 'r' at 0x00FED020> <open file '<stdout>', mode 'w' at 0x00FED078> <open file '<stderr>', mode 'w' at 0x00FED0D0> >>>
能夠發現,sys.__stdout__
與sys.stdout
取值並不相同。而在普通的Python解釋器下(如經過Windows控制檯)運行上述代碼時,二者取值相同。ide
print語句(statement)不以逗號結尾時,會在輸出字符串尾部自動附加一個換行符(linefeed);不然將一個空格代替附加的換行符。print語句默認寫入標準輸出流,也可重定向至文件或其餘可寫對象(全部提供write方法的對象)。這樣,就可使用簡潔的print語句代替笨拙的object.write('hello'+'\n')寫法。函數
由上可知,在Python中調用print obj打印對象時,缺省狀況下等效於調用sys.stdout.write(obj+'\n')。示例以下:性能
>>> import sys >>> print 'Hello World' Hello World >>> sys.stdout.write('Hello World') Hello World
本節介紹經常使用的Python標準輸出重定向方式。這些方法各有優劣之處,適用於不一樣的場景。優化
最簡單經常使用的輸出重定向方式是利用控制檯命令。這種重定向由控制檯完成,而與Python自己無關。this
Windows命令提示符(cmd.exe)和Linux Shell(bash等)均經過">"或">>"將輸出重定向。其中,">"表示覆蓋內容,">>"表示追加內容。相似地,"2>"可重定向標準錯誤。重定向到"nul"(Windows)或"/dev/null"(Linux)會抑制輸出,既不屏顯也不存盤。
以Windows命令提示符爲例,將Python腳本輸出重定向到文件(爲縮短篇幅已刪除命令間空行):
E:\>echo print 'hello' > test.py E:\>test.py > out.txt E:\>type out.txt hello E:\>test.py >> out.txt E:\>type out.txt hello hello E:\>test.py > nul
注意,在Windows命令提示符中執行Python腳本時,命令行無需以"python"開頭,系統會根據腳本後綴自動調用Python解釋器。此外,type命令可直接顯示文本文件的內容,相似Linux系統的cat命令。
Linux Shell中執行Python腳本時,命令行應以"python"開頭。除">"或">>"重定向外,還可以使用tee命令。該命令可將內容同時輸出到終端屏幕和(多個)文件中,"-a"選項表示追加寫入,不然覆蓋寫入。示例以下(echo $SHELL
或echo $0
顯示當前所使用的Shell):
[wangxiaoyuan_@localhost ~]$ echo $SHELL /bin/bash [wangxiaoyuan_@localhost ~]$ python -c "print 'hello'" hello [wangxiaoyuan_@localhost ~]$ python -c "print 'hello'" > out.txt [wangxiaoyuan_@localhost ~]$ cat out.txt hello [wangxiaoyuan_@localhost ~]$ python -c "print 'world'" >> out.txt [wangxiaoyuan_@localhost ~]$ cat out.txt hello world [wangxiaoyuan_@localhost ~]$ python -c "print 'I am'" | tee out.txt I am [wangxiaoyuan_@localhost ~]$ python -c "print 'xywang'" | tee -a out.txt xywang [wangxiaoyuan_@localhost ~]$ cat out.txt I am xywang [wangxiaoyuan_@localhost ~]$ python -c "print 'hello'" > /dev/null [wangxiaoyuan_@localhost ~]$
若僅僅想要將腳本輸出保存到文件中,也可直接藉助會話窗口的日誌抓取功能。
注意,控制檯重定向的影響是全局性的,僅適用於比較簡單的輸出任務。
這種方式基於print語句的擴展形式,即"print obj >> expr"
。其中,obj
爲一個file-like(尤爲是提供write方法的)對象,爲None時對應標準輸出(sys.stdout)。expr
將被輸出到該文件對象中。示例以下:
memo = cStringIO.StringIO(); serr = sys.stderr; file = open('out.txt', 'w+') print >>memo, 'StringIO'; print >>serr, 'stderr'; print >>file, 'file' print >>None, memo.getvalue()
上述代碼執行後,屏顯爲"serr"和"StringIO"(兩行,注意順序),out.txt文件內寫入"file"。
可見,這種方式很是靈活和方便。缺點是不適用於輸出語句較多的場景。
將一個可寫對象(如file-like對象)賦給sys.stdout,可以使隨後的print語句輸出至該對象。重定向結束後,應將sys.stdout恢復最初的缺省值,即標準輸出。
簡單示例以下:
import sys savedStdout = sys.stdout #保存標準輸出流 with open('out.txt', 'w+') as file: sys.stdout = file #標準輸出重定向至文件 print 'This message is for file!' sys.stdout = savedStdout #恢復標準輸出流 print 'This message is for screen!'
注意,IDLE中sys.stdout
初值爲PseudoOutputFile對象,與sys.__stdout__
並不相同。爲求通用,本例另行定義變量(savedStdout)保存sys.stdout
,下文也將做此處理。此外,本例不適用於經由from sys import stdout
導入的stdout對象。
如下將自定義多種具備write()方法的file-like對象,以知足不一樣需求:
class RedirectStdout: #import os, sys, cStringIO def __init__(self): self.content = '' self.savedStdout = sys.stdout self.memObj, self.fileObj, self.nulObj = None, None, None #外部的print語句將執行本write()方法,並由當前sys.stdout輸出 def write(self, outStr): #self.content.append(outStr) self.content += outStr def toCons(self): #標準輸出重定向至控制檯 sys.stdout = self.savedStdout #sys.__stdout__ def toMemo(self): #標準輸出重定向至內存 self.memObj = cStringIO.StringIO() sys.stdout = self.memObj def toFile(self, file='out.txt'): #標準輸出重定向至文件 self.fileObj = open(file, 'a+', 1) #改成行緩衝 sys.stdout = self.fileObj def toMute(self): #抑制輸出 self.nulObj = open(os.devnull, 'w') sys.stdout = self.nulObj def restore(self): self.content = '' if self.memObj.closed != True: self.memObj.close() if self.fileObj.closed != True: self.fileObj.close() if self.nulObj.closed != True: self.nulObj.close() sys.stdout = self.savedStdout #sys.__stdout__
注意,toFile()方法中,open(name[, mode[, buffering]])調用選擇行緩衝(無緩衝會影響性能)。這是爲了觀察中間寫入過程,不然只有調用close()或flush()後輸出纔會寫入文件。內部調用open()方法的缺點是不便於用戶定製寫文件規則,如模式(覆蓋或追加)和緩衝(行或全緩衝)。
重定向效果以下:
redirObj = RedirectStdout() sys.stdout = redirObj #本句會抑制"Let's begin!"輸出 print "Let's begin!" #屏顯'Hello World!'和'I am xywang.'(兩行) redirObj.toCons(); print 'Hello World!'; print 'I am xywang.' #寫入'How are you?'和"Can't complain."(兩行) redirObj.toFile(); print 'How are you?'; print "Can't complain." redirObj.toCons(); print "What'up?" #屏顯 redirObj.toMute(); print '<Silence>' #無屏顯或寫入 os.system('echo Never redirect me!') #控制檯屏顯'Never redirect me!' redirObj.toMemo(); print 'What a pity!' #無屏顯或寫入 redirObj.toCons(); print 'Hello?' #屏顯 redirObj.toFile(); print "Oh, xywang can't hear me" #該串寫入文件 redirObj.restore() print 'Pop up' #屏顯
可見,執行toXXXX()語句後,標準輸出流將被重定向到XXXX。此外,toMute()和toMemo()的效果相似,都可抑制輸出。
使用某對象替換sys.stdout時,儘可能確保該對象接近文件對象,尤爲是涉及第三方庫時(該庫可能使用sys.stdout的其餘方法)。此外,本節替換sys.stdout的代碼實現並不影響由os.popen()、os.system()或os.exec*()系列方法所建立進程的標準I/O流。這些涉及底層控制,其重定向方式可參考"Redirecting all kinds of stdout in Python"一文。
本節嚴格意義上並不是新的重定向方式,而是利用Pyhton上下文管理器優化上節的代碼實現。藉助於上下文管理器語法,可沒必要向重定向使用者暴露sys.stdout。
首先考慮輸出抑制,基於上下文管理器語法實現以下:
import sys, cStringIO, contextlib class DummyFile: def write(self, outStr): pass @contextlib.contextmanager def MuteStdout(): savedStdout = sys.stdout sys.stdout = cStringIO.StringIO() #DummyFile() try: yield except Exception: #捕獲到錯誤時,屏顯被抑制的輸出(該處理並不是必需) content, sys.stdout = sys.stdout, savedStdout print content.getvalue()#; raise #finally: sys.stdout = savedStdout
使用示例以下:
with MuteStdout(): print "I'll show up when <raise> is executed!" #不屏顯不寫入 raise #屏顯上句 print "I'm hiding myself somewhere:)" #不屏顯
再考慮更通用的輸出重定向:
import os, sys from contextlib import contextmanager @contextmanager def RedirectStdout(newStdout): savedStdout, sys.stdout = sys.stdout, newStdout try: yield finally: sys.stdout = savedStdout
使用示例以下:
def Greeting(): print 'Hello, boss!' with open('out.txt', "w+") as file: print "I'm writing to you..." #屏顯 with RedirectStdout(file): print 'I hope this letter finds you well!' #寫入文件 print 'Check your mailbox.' #屏顯 with open(os.devnull, "w+") as file, RedirectStdout(file): Greeting() #不屏顯不寫入 print 'I deserve a pay raise:)' #不屏顯不寫入 print 'Did you hear what I said?' #屏顯
可見,with內嵌塊裏的函數和print語句輸出均被重定向。注意,上述示例不是線程安全的,主要適用於單線程。
當函數被頻繁調用時,建議使用裝飾器包裝該函數。這樣,僅需修改該函數定義,而無需在每次調用該函數時使用with語句包裹。示例以下:
import sys, cStringIO, functools def MuteStdout(retCache=False): def decorator(func): @functools.wraps(func) def wrapper(*args, **kwargs): savedStdout = sys.stdout sys.stdout = cStringIO.StringIO() try: ret = func(*args, **kwargs) if retCache == True: ret = sys.stdout.getvalue().strip() finally: sys.stdout = savedStdout return ret return wrapper return decorator
若裝飾器MuteStdout的參數retCache爲真,外部調用func()函數時將返回該函數內部print輸出的內容(可供屏顯);若retCache爲假,外部調用func()函數時將返回該函數的返回值(抑制輸出)。
MuteStdout裝飾器使用示例以下:
@MuteStdout(True) def Exclaim(): print 'I am proud of myself!' @MuteStdout() def Mumble(): print 'I lack confidence...'; return 'sad' print Exclaim(), Exclaim.__name__ #屏顯'I am proud of myself! Exclaim' print Mumble(), Mumble.__name__ #屏顯'sad Mumble'
在全部線程中,被裝飾函數執行期間,sys.stdout都會被MuteStdout裝飾器劫持。並且,函數一經裝飾便沒法移除裝飾。所以,使用該裝飾器時應慎重考慮場景。
接着,考慮建立RedirectStdout裝飾器:
def RedirectStdout(newStdout=sys.stdout): def decorator(func): def wrapper(*args,**kwargs): savedStdout, sys.stdout = sys.stdout, newStdout try: return func(*args, **kwargs) finally: sys.stdout = savedStdout return wrapper return decorator
使用示例以下:
file = open('out.txt', "w+") @RedirectStdout(file) def FunNoArg(): print 'No argument.' @RedirectStdout(file) def FunOneArg(a): print 'One argument:', a def FunTwoArg(a, b): print 'Two arguments: %s, %s' %(a,b) FunNoArg() #寫文件'No argument.' FunOneArg(1984) #寫文件'One argument: 1984' RedirectStdout()(FunTwoArg)(10,29) #屏顯'Two arguments: 10, 29' print FunNoArg.__name__ #屏顯'wrapper'(應顯示'FunNoArg') file.close()
注意FunTwoArg()函數的定義和調用與其餘函數的不一樣,這是兩種等效的語法。此外,RedirectStdout裝飾器的最內層函數wrapper()未使用"functools.wraps(func)"修飾,會丟失被裝飾函數原有的特殊屬性(如函數名、文檔字符串等)。
對於代碼量較大的工程,建議使用logging模塊進行輸出。該模塊是線程安全的,可將日誌信息輸出到控制檯、寫入文件、使用TCP/UDP協議發送到網絡等等。
默認狀況下logging模塊將日誌輸出到控制檯(標準出錯),且只顯示大於或等於設置的日誌級別的日誌。日誌級別由高到低爲CRITICAL > ERROR > WARNING > INFO > DEBUG > NOTSET,默認級別爲WARNING。
如下示例將日誌信息分別輸出到控制檯和寫入文件:
import logging logging.basicConfig(level = logging.DEBUG, format = '%(asctime)s [%(levelname)s] at %(filename)s,%(lineno)d: %(message)s', datefmt = '%Y-%m-%d(%a)%H:%M:%S', filename = 'out.txt', filemode = 'w') #將大於或等於INFO級別的日誌信息輸出到StreamHandler(默認爲標準錯誤) console = logging.StreamHandler() console.setLevel(logging.INFO) formatter = logging.Formatter('[%(levelname)-8s] %(message)s') #屏顯實時查看,無需時間 console.setFormatter(formatter) logging.getLogger().addHandler(console) logging.debug('gubed'); logging.info('ofni'); logging.critical('lacitirc')
經過對多個handler設置不一樣的level參數,可將不一樣的日誌內容輸入到不一樣的地方。本例使用在logging模塊內置的StreamHandler(和FileHandler),運行後屏幕上顯示:
[INFO ] ofni [CRITICAL] lacitirc
out.txt文件內容則爲:
2016-05-13(Fri)17:10:53 [DEBUG] at test.py,25: gubed 2016-05-13(Fri)17:10:53 [INFO] at test.py,25: ofni 2016-05-13(Fri)17:10:53 [CRITICAL] at test.py,25: lacitirc
除直接在程序中設置Logger、Handler、Formatter等外,還可將這些信息寫入配置文件。示例以下:
#logger.conf ###############Logger############### [loggers] keys=root,Logger2F,Logger2CF [logger_root] level=DEBUG handlers=hWholeConsole [logger_Logger2F] handlers=hWholeFile qualname=Logger2F propagate=0 [logger_Logger2CF] handlers=hPartialConsole,hPartialFile qualname=Logger2CF propagate=0 ###############Handler############### [handlers] keys=hWholeConsole,hPartialConsole,hWholeFile,hPartialFile [handler_hWholeConsole] class=StreamHandler level=DEBUG formatter=simpFormatter args=(sys.stdout,) [handler_hPartialConsole] class=StreamHandler level=INFO formatter=simpFormatter args=(sys.stderr,) [handler_hWholeFile] class=FileHandler level=DEBUG formatter=timeFormatter args=('out.txt', 'a') [handler_hPartialFile] class=FileHandler level=WARNING formatter=timeFormatter args=('out.txt', 'w') ###############Formatter############### [formatters] keys=simpFormatter,timeFormatter [formatter_simpFormatter] format=[%(levelname)s] at %(filename)s,%(lineno)d: %(message)s [formatter_timeFormatter] format=%(asctime)s [%(levelname)s] at %(filename)s,%(lineno)d: %(message)s datefmt=%Y-%m-%d(%a)%H:%M:%S
此處共建立三個Logger:root,將全部日誌輸出至控制檯;Logger2F,將全部日誌寫入文件;Logger2CF,將級別大於或等於INFO的日誌輸出至控制檯,將級別大於或等於WARNING的日誌寫入文件。
程序以以下方式解析配置文件和重定向輸出:
import logging, logging.config logging.config.fileConfig("logger.conf") logger = logging.getLogger("Logger2CF") logger.debug('gubed'); logger.info('ofni'); logger.warn('nraw') logger.error('rorre'); logger.critical('lacitirc') logger1 = logging.getLogger("Logger2F") logger1.debug('GUBED'); logger1.critical('LACITIRC') logger2 = logging.getLogger() logger2.debug('gUbEd'); logger2.critical('lAcItIrC')
運行後屏幕上顯示:
[INFO] at test.py,7: ofni [WARNING] at test.py,7: nraw [ERROR] at test.py,8: rorre [CRITICAL] at test.py,8: lacitirc [DEBUG] at test.py,14: gUbEd [CRITICAL] at test.py,14: lAcItIrC
out.txt文件內容則爲:
2016-05-13(Fri)20:31:21 [WARNING] at test.py,7: nraw 2016-05-13(Fri)20:31:21 [ERROR] at test.py,8: rorre 2016-05-13(Fri)20:31:21 [CRITICAL] at test.py,8: lacitirc 2016-05-13(Fri)20:31:21 [DEBUG] at test.py,11: GUBED 2016-05-13(Fri)20:31:21 [CRITICAL] at test.py,11: LACITIRC
本文主要參考如下資料(包括但不限於):