程序員必知的Python陷阱與缺陷列表

時間 2021-08-13

標籤 html python 程序員編程 python3.x 數組閉包 app dom python2.7 欄目快樂工作简体版

原文原文鏈接

代碼看起來能夠工做，但不是以你「想固然「」的方式。若是一段代碼直接出錯，拋出了異常，我不認爲這是陷阱。好比，Python程序員應該都遇到過的「UnboundLocalError", 示例：html

　　>>> a=1python

　　>>> def func():程序員

　　... a+=1編程

　　... print apython3.x

　　... 數組

　　>>> func()閉包

　　Traceback (most recent call last):app

　　 File "<stdin>", line 1, in <module>dom

　　 File "<stdin>", line 2, in funcpython2.7

　　UnboundLocalError: local variable 'a' referenced before assignment

　　對於「UnboundLocalError",還有更高級的版本：

import randomdef func(ok):    if ok:
        a = random.random()    else:        import random
        a = random.randint(1, 10)    return a

func(True)# UnboundLocalError: local variable 'random' referenced before assignment

　　可能對於不少python新手來講，這個Error讓人摸不着頭腦。但我認爲這不算陷阱，由於這段代碼必定會報錯，而不是默默的以錯誤的方式運行。不怕真小人，就怕僞君子。我認爲缺陷就比如僞君子。

　　那麼Python中哪些真正算得上陷阱呢

　　本文地址：ht t p: / / w w w . c nb l o g s . c o m / x y ba b y /p/7183854.html

　　第一：以mutable對象做爲默認參數

　　這個估計是最廣爲人知的了，Python和其餘不少語言同樣，提供了默認參數，默認參數確實是個好東西，可讓函數調用者忽略一些細節（好比GUI編程，Tkinter，QT），對於lambda表達式也很是有用。可是若是使用了可變對象做爲默認參數，那麼事情就不那麼愉快了

　　>>> def f(lst = []):

　　... lst.append(1)

　　... return lst

　　...

　　>>> f()

　　[1]

　　>>> f()

　　[1, 1]

　　驚喜不驚喜？！究其緣由，python中一切都是對象，函數也不列外，默認參數只是函數的一個屬性。而默認參數在函數定義的時候已經求值了。

　　Default parameter values are evaluated when the function definition is executed.

　　stackoverflow上有一個更適當的例子來講明默認參數是在定義的時候求值，而不是調用的時候。

　　>>> import time

　　>>> def report(when=time.time()):

　　... return when

　　...

　　>>> report()

　　1500113234.487932

　　>>> report()

　　1500113234.487932

　　python docoment 給出了標準的解決辦法：

　　A way around this is to use None as the default, and explicitly test for it in the body of the function

　　>>> def report(when=None):

　　... if when is None:

　　... when = time.time()

　　... return when

　　...

　　>>> report()

　　1500113446.746997

　　>>> report()

　　1500113448.552873

　　第二: x += y vs x = x + y

　　通常來講，兩者是等價的，至少看起來是等價的（這也是陷阱的定義 -- 看起來都OK，但不必定正確）。

　　>>> x=1;x += 1;print x

　　>>> x=1;x = x+1;print x

　　>>> x=[1];x+=[2];print x

　　[1, 2]

　　>>> x=[1];x=x+[2];print x

　　[1, 2]

　　呃，被光速打臉了？

　　>>> x=[1];print id(x);x=x+[2];print id(x)

　　4357132800

　　4357132728

　　>>> x=[1];print id(x);x+=[2];print id(x)

　　4357132800

　　前者x指向一個新的對象，後者x在原來的對象是修改，固然，那種效果是正確的取決於應用場景。至少，得知道，兩者有時候並不同

　　第三，神奇的小括號--()

　　小括號（parenthese）在各類編程語言中都有普遍的應用，python中，小括號還能表示元組（tuple）這一數據類型, 元組是immutable的序列。

　　>>> a = (1, 2)

　　>>> type(a)

　　>>> type(())

　　但若是隻有一個元素呢

　　>>> a=(1)

　　>>> type(a)

　　神奇不神奇，若是要表示只有一個元素的元組，正確的姿式是:

　　>>> a=(1,)

　　>>> type(a)

　　第四：生成一個元素是列表的列表

　　這個有點像二維數組，固然生成一個元素是字典的列表也是能夠的，更通俗的說，生成一個元素是可變對象的序列

　　很簡單嘛：

　　>>> a= [[]] * 10

　　>>> a

　　[[], [], [], [], [], [], [], [], [], []]

　　>>> a[0].append(10)

　　>>> a[0]

　　[10]

　　看起來很不錯，簡單明瞭，but

　　>>> a[1]

　　[10]

　　>>> a

　　[[10], [10], [10], [10], [10], [10], [10], [10], [10], [10]]

　　我猜，這英國不是你預期的結果吧，究其緣由，仍是由於python中list是可變對象，上述的寫法你們都指向的同一個可變對象，正確的姿式

　　>>> a = [[] for _ in xrange(10)]

　　>>> a[0].append(10)

　　>>> a

　　[[10], [], [], [], [], [], [], [], [], []]

　　第五，在訪問列表的時候，修改列表

　　列表（list）在python中使用很是普遍，固然常常會在訪問列表的時候增長或者刪除一些元素。好比，下面這個函數，試圖刪掉列表中爲3的倍數的元素：

　　>>> def modify_lst(lst):

　　... for idx, elem in enumerate(lst):

　　... if elem % 3 == 0:

　　... del lst[idx]

　　...

　　測試一下，

　　>>> lst = [1,2,3,4,5,6]

　　>>> modify_lst(lst)

　　>>> lst

　　[1, 2, 4, 5]

　　好像沒什麼錯，不過這只是運氣好

　　>>> lst = [1,2,3,6,5,4]

　　>>> modify_lst(lst)

　　>>> lst

　　[1, 2, 6, 5, 4]

　　上面的例子中，6這個元素就沒有被刪除。若是在modify_lst函數中print idx， item就能夠發現端倪：lst在變短，但idx是遞增的，因此在上面出錯的例子中，當3被刪除以後，6變成了lst的第2個元素（從0開始）。在C++中，若是遍歷容器的時候用迭代器刪除元素，也會有一樣的問題。

　　若是邏輯比較簡單，使用list comprehension是不錯的注意

　　第六，閉包與lambda

　　這個也是老生長談的例子，在其餘語言也有相似的狀況。先看一個例子:

　　>>> def create_multipliers():

　　... return [lambda x:i*x for i in range(5)]

　　...

　　>>> for multiplier in create_multipliers():

　　... print multiplier(2)

　　...

　　create_multipliers函數的返回值時一個列表，列表的每個元素都是一個函數－－將輸入參數x乘以一個倍數i的函數。預期的結果時0，2，4，6，8. 但結果是5個8，意外不意外。

　　因爲出現這個陷阱的時候常用了lambda，因此可能會認爲是lambda的問題，但lambda表示不肯意背這個鍋。問題的本質在與python中的屬性查找規則，LEGB（local，enclousing，global，bulitin），在上面的例子中，i就是在閉包做用域（enclousing），而Python的閉包是 遲綁定 ，這意味着閉包中用到的變量的值，是在內部函數被調用時查詢獲得的。

　　解決辦法也很簡單，那就是變閉包做用域爲局部做用域。

　　>>> def create_multipliers():

　　... return [lambda x, i = i:i*x for i in range(5)]

　　...

　　第七，定義__del__

　　大多數計算機專業的同窗可能都是先學的C、C++，構造、析構函數的概念應該都很是熟。因而，當切換到python的時候，天然也想知道有沒有相應的函數。好比，在C++中很是有名的RAII，即經過構造、析構來管理資源（如內存、文件描述符）的聲明週期。那在python中要達到一樣的效果怎麼作呢，即須要找到一個對象在銷燬的時候必定會調用的函數，因而發現了__init__, __del__函數，可能簡單寫了兩個例子發現確實也能工做。但事實上可能掉進了一個陷阱，在python documnet是有描述的：

　　Circular references which are garbage are detected when the option cycle detector is enabled (it’s on by default), but can only be cleaned up if there are no Python-level __del__() methods involved.

　　簡單來講，若是在循環引用中的對象定義了__del__,那麼python gc不能進行回收，所以，存在內存泄漏的風險

　　第八，不一樣的姿式import同一個module

　　示例在stackoverflow的例子上稍做修改，假設如今有一個package叫mypackage，裏面包含三個python文件：mymodule.py, main.py, __init__.py。mymodule.py代碼以下：

1 l = []2 class A(object): 
3     pass

　　main.py代碼以下：

 1 def add(x): 2     from mypackage import mymodule 3     mymodule.l.append(x) 4     print "updated list",mymodule.l, id(mymodule) 5  6 def get(): 7     import mymodule 8     print 'module in get', id(mymodule) 9     return mymodule.l10 11 if __name__ == '__main__':12     import sys13     sys.path.append('../')14     add(1)15     16     ret = get()17     print "lets check", ret

　　運行python main.py，結果以下：　　

　　updated list [1] 4406700752
　　module in get 4406700920
　　lets check []

　　從運行結果能夠看到，在add 和 get函數中import的mymodule不是同一個module，ID不一樣。固然，在python2.7.10中，須要main.py的第13行才能出現這樣的效果。你可能會問，誰會寫出第13行這樣的代碼呢？事實上，在不少項目中，爲了import的時候方便，會往sys.path加入一堆路徑。那麼在項目中，你們贊成一種import方式就很是有必要了

　　第九，python升級

　　python3.x並不向後兼容，因此若是從2.x升級到3.x的時候得當心了，下面列舉兩點：

　　在python2.7中，range的返回值是一個列表；而在python3.x中，返回的是一個range對象。

　　map()、filter()、 dict.items()在python2.7返回列表，而在3.x中返回迭代器。固然迭代器大多數都是比較好的選擇，更加pythonic，可是也有缺點，就是隻能遍歷一次。在instagram的分享中，也提到由於這個致使的一個坑爹的bug。

　　第十，gil

　　以GIL結尾，由於gil是Python中你們公認的缺陷！

　　從其餘語言過來的同窗可能看到python用threading模塊，拿過來就用，結果發現效果不對啊，而後就會噴，什麼鬼