你們好。python
今天給你們分享 10 個我平時整理很是實用的 Python 開發小技巧,內容目錄以下:linux
值得一提的是,這 10 個技巧所有收錄在我本身寫的 《Python黑魔法指南》裏redis
你能夠在按照以下方法,後臺發送『黑魔法』就能夠獲取精美排版的 PDF 電子書。shell
查看函數的源代碼,咱們一般會使用 IDE 來完成。緩存
好比在 PyCharm 中,你能夠 Ctrl + 鼠標點擊 進入函數的源代碼。app
那若是沒有 IDE 呢?python2.7
當咱們想使用一個函數時,如何知道這個函數須要接收哪些參數呢?函數
當咱們在使用函數時出現問題的時候,如何經過閱讀源代碼來排查問題所在呢?性能
這時候,咱們可使用 inspect 來代替 IDE 幫助你完成這些事測試
# demo.py import inspect def add(x, y): return x + y print("===================") print(inspect.getsource(add))
運行結果以下
$ python demo.py =================== def add(x, y): return x + y
當你在處理異常時,因爲處理不當或者其餘問題,再次拋出另外一個異常時,往外拋出的異常也會攜帶原始的異常信息。
就像這樣子。
try: print(1 / 0) except Exception as exc: raise RuntimeError("Something bad happened")
從輸出能夠看到兩個異常信息
Traceback (most recent call last): File "demo.py", line 2, in <module> print(1 / 0) ZeroDivisionError: division by zero During handling of the above exception, another exception occurred: Traceback (most recent call last): File "demo.py", line 4, in <module> raise RuntimeError("Something bad happened") RuntimeError: Something bad happened
若是在異常處理程序或 finally 塊中引起異常,默認狀況下,異常機制會隱式工做會將先前的異常附加爲新異常的 __context__
屬性。這就是 Python 默認開啓的自動關聯異常上下文。
若是你想本身控制這個上下文,能夠加個 from 關鍵字(from
語法會有個限制,就是第二個表達式必須是另外一個異常類或實例。),來代表你的新異常是直接由哪一個異常引發的。
try: print(1 / 0) except Exception as exc: raise RuntimeError("Something bad happened") from exc
輸出以下
Traceback (most recent call last): File "demo.py", line 2, in <module> print(1 / 0) ZeroDivisionError: division by zero The above exception was the direct cause of the following exception: Traceback (most recent call last): File "demo.py", line 4, in <module> raise RuntimeError("Something bad happened") from exc RuntimeError: Something bad happened
固然,你也能夠經過with_traceback()
方法爲異常設置上下文__context__
屬性,這也能在traceback
更好的顯示異常信息。
try: print(1 / 0) except Exception as exc: raise RuntimeError("bad thing").with_traceback(exc)
最後,若是我想完全關閉這個自動關聯異常上下文的機制?有什麼辦法呢?
可使用 raise...from None
,從下面的例子上看,已經沒有了原始異常
$ cat demo.py try: print(1 / 0) except Exception as exc: raise RuntimeError("Something bad happened") from None $ $ python demo.py Traceback (most recent call last): File "demo.py", line 4, in <module> raise RuntimeError("Something bad happened") from None RuntimeError: Something bad happened (PythonCodingTime)
當你使用 import 導入一個包或模塊時,Python 會去一些目錄下查找,而這些目錄是有優先級順序的,正常人會使用 sys.path 查看。
>>> import sys >>> from pprint import pprint >>> pprint(sys.path) ['', '/usr/local/Python3.7/lib/python37.zip', '/usr/local/Python3.7/lib/python3.7', '/usr/local/Python3.7/lib/python3.7/lib-dynload', '/home/wangbm/.local/lib/python3.7/site-packages', '/usr/local/Python3.7/lib/python3.7/site-packages'] >>>
那有沒有更快的方式呢?
我這有一種連 console 模式都不用進入的方法呢?
你可能會想到這種,但這本質上與上面並沒有區別
[wangbm@localhost ~]$ python -c "print('\n'.join(__import__('sys').path))" /usr/lib/python2.7/site-packages/pip-18.1-py2.7.egg /usr/lib/python2.7/site-packages/redis-3.0.1-py2.7.egg /usr/lib64/python27.zip /usr/lib64/python2.7 /usr/lib64/python2.7/plat-linux2 /usr/lib64/python2.7/lib-tk /usr/lib64/python2.7/lib-old /usr/lib64/python2.7/lib-dynload /home/wangbm/.local/lib/python2.7/site-packages /usr/lib64/python2.7/site-packages /usr/lib64/python2.7/site-packages/gtk-2.0 /usr/lib/python2.7/site-packages
這裏我要介紹的是比上面兩種都方便的多的方法,一行命令便可解決
[wangbm@localhost ~]$ python3 -m site sys.path = [ '/home/wangbm', '/usr/local/Python3.7/lib/python37.zip', '/usr/local/Python3.7/lib/python3.7', '/usr/local/Python3.7/lib/python3.7/lib-dynload', '/home/wangbm/.local/lib/python3.7/site-packages', '/usr/local/Python3.7/lib/python3.7/site-packages', ] USER_BASE: '/home/wangbm/.local' (exists) USER_SITE: '/home/wangbm/.local/lib/python3.7/site-packages' (exists) ENABLE_USER_SITE: True
從輸出你能夠發現,這個列的路徑會比 sys.path 更全,它包含了用戶環境的目錄。
咱們常常會以下這種嵌套的 for 循環代碼
list1 = range(1,3) list2 = range(4,6) list3 = range(7,9) for item1 in list1: for item2 in list2: for item3 in list3: print(item1+item2+item3)
這裏僅僅是三個 for 循環,在實際編碼中,有可能會有更層。
這樣的代碼,可讀性很是的差,不少人不想這麼寫,可又沒有更好的寫法。
這裏介紹一種我經常使用的寫法,使用 itertools 這個庫來實現更優雅易讀的代碼。
from itertools import product list1 = range(1,3) list2 = range(4,6) list3 = range(7,9) for item1,item2,item3 in product(list1, list2, list3): print(item1+item2+item3)
輸出以下
$ python demo.py 12 13 13 14 13 14 14 15
初學者喜歡使用 print 來調試代碼,並記錄程序運行過程。
可是 print 只會將內容輸出到終端上,不能持久化到日誌文件中,並不利於問題的排查。
若是你熱衷於使用 print 來調試代碼(雖然這並非最佳作法),記錄程序運行過程,那麼下面介紹的這個 print 用法,可能會對你有用。
Python 3 中的 print 做爲一個函數,因爲能夠接收更多的參數,因此功能變爲更增強大,指定一些參數能夠將 print 的內容輸出到日誌文件中
代碼以下:
>>> with open('test.log', mode='w') as f: ... print('hello, python', file=f, flush=True) >>> exit() $ cat test.log hello, python
計算一個函數的運行時間,你可能會這樣子作
import time start = time.time() # run the function end = time.time() print(end-start)
你看看你爲了計算函數運行時間,寫了幾行代碼了。
有沒有一種方法能夠更方便的計算這個運行時間呢?
有。
有一個內置模塊叫 timeit
使用它,只用一行代碼便可
import time import timeit def run_sleep(second): print(second) time.sleep(second) # 只用這一行 print(timeit.timeit(lambda :run_sleep(2), number=5))
運行結果以下
2 2 2 2 2 10.020059824
緩存是一種將定量數據加以保存,以備迎合後續獲取需求的處理方式,旨在加快數據獲取的速度。
數據的生成過程可能須要通過計算,規整,遠程獲取等操做,若是是同一份數據須要屢次使用,每次都從新生成會大大浪費時間。因此,若是將計算或者遠程請求等操做得到的數據緩存下來,會加快後續的數據獲取需求。
爲了實現這個需求,Python 3.2 + 中給咱們提供了一個機制,能夠很方便的實現,而不須要你去寫這樣的邏輯代碼。
這個機制實現於 functool 模塊中的 lru_cache 裝飾器。
@functools.lru_cache(maxsize=None, typed=False)
參數解讀:
舉個例子
from functools import lru_cache @lru_cache(None) def add(x, y): print("calculating: %s + %s" % (x, y)) return x + y print(add(1, 2)) print(add(1, 2)) print(add(2, 3))
輸出以下,能夠看到第二次調用並無真正的執行函數體,而是直接返回緩存裏的結果
calculating: 1 + 2 3 3 calculating: 2 + 3 5
下面這個是經典的斐波那契數列,當你指定的 n 較大時,會存在大量的重複計算
def fib(n): if n < 2: return n return fib(n - 2) + fib(n - 1)
第六點介紹的 timeit,如今能夠用它來測試一下到底能夠提升多少的效率。
不使用 lru_cache 的狀況下,運行時間 31 秒
import timeit def fib(n): if n < 2: return n return fib(n - 2) + fib(n - 1) print(timeit.timeit(lambda :fib(40), number=1)) # output: 31.2725698948
因爲使用了 lru_cache 後,運行速度實在太快了,因此我將 n 值由 30 調到 500,可即便是這樣,運行時間也才 0.0004 秒。提升速度很是顯著。
import timeit from functools import lru_cache @lru_cache(None) def fib(n): if n < 2: return n return fib(n - 2) + fib(n - 1) print(timeit.timeit(lambda :fib(500), number=1)) # output: 0.0004921059880871326
使用 atexit 這個內置模塊,能夠很方便的註冊退出函數。
無論你在哪一個地方致使程序崩潰,都會執行那些你註冊過的函數。
示例以下
若是clean()
函數有參數,那麼你能夠不用裝飾器,而是直接調用atexit.register(clean_1, 參數1, 參數2, 參數3='xxx')
。
可能你有其餘方法能夠處理這種需求,但確定比上不使用 atexit 來得優雅,來得方便,而且它很容易擴展。
可是使用 atexit 仍然有一些侷限性,好比:
os._exit()
,你註冊的函數沒法正常執行。在 Golang 中有一種延遲調用的機制,關鍵字是 defer,例以下面的示例
import "fmt" func myfunc() { fmt.Println("B") } func main() { defer myfunc() fmt.Println("A") }
輸出以下,myfunc 的調用會在函數返回前一步完成,即便你將 myfunc 的調用寫在函數的第一行,這就是延遲調用。
A B
那麼在 Python 中否有這種機制呢?
固然也有,只不過並無 Golang 這種簡便。
在 Python 可使用 上下文管理器 達到這種效果
import contextlib def callback(): print('B') with contextlib.ExitStack() as stack: stack.callback(callback) print('A')
輸出以下
A B
使用 with...open... 能夠從一個文件中讀取數據,這是全部 Python 開發者都很是熟悉的操做。
可是若是你使用不當,也會帶來很大的麻煩。
好比當你使用了 read 函數,其實 Python 會將文件的內容一次性的所有載入內存中,若是文件有 10 個G甚至更多,那麼你的電腦就要消耗的內存很是巨大。
# 一次性讀取 with open("big_file.txt", "r") as fp: content = fp.read()
對於這個問題,你也許會想到使用 readline 去作一個生成器來逐行返回。
def read_from_file(filename): with open(filename, "r") as fp: yield fp.readline()
可若是這個文件內容就一行呢,一行就 10個G,其實你仍是會一次性讀取所有內容。
最優雅的解決方法是,在使用 read 方法時,指定每次只讀取固定大小的內容,好比下面的代碼中,每次只讀取 8kb 返回。
def read_from_file(filename, block_size = 1024 * 8): with open(filename, "r") as fp: while True: chunk = fp.read(block_size) if not chunk: break yield chunk
上面的代碼,功能上已經沒有問題了,可是代碼看起來代碼仍是有些臃腫。
藉助偏函數 和 iter 函數能夠優化一下代碼
from functools import partial def read_from_file(filename, block_size = 1024 * 8): with open(filename, "r") as fp: for chunk in iter(partial(fp.read, block_size), ""): yield chunk