python基礎(5):深刻理解 python 中的賦值、引用、拷貝、做用域

目錄[-]html

在 python 中賦值語句老是創建對象的引用值,而不是複製對象。所以,python 變量更像是指針,而不是數據存儲區域,spa


這點和大多數 OO 語言相似吧,好比 C++、java 等 ~.net

一、先來看個問題吧:

在Python中,令values=[0,1,2];values[1]=values,爲什麼結果是[0,[...],2]?指針

1 >>> values = [012]
2 >>> values[1= values
3 >>> values
4 [0, [...], 2]

我預想應當是  
code

[0, [0, 1, 2], 2]

但結果卻爲什麼要賦值無限次?htm

能夠說 Python 沒有賦值,只有引用。你這樣至關於建立了一個引用自身的結構,因此致使了無限循環。爲了理解這個問題,有個基本概念須要搞清楚。

Python 沒有「變量」,咱們平時所說的變量其實只是「標籤」,是引用。

執行 

values = [0, 1, 2]

的時候,Python 作的事情是首先建立一個列表對象 [0, 1, 2],而後給它貼上名爲 values 的標籤。若是隨後又執行 

values = [3, 4, 5]

的話,Python 作的事情是建立另外一個列表對象 [3, 4, 5],而後把剛纔那張名爲 values 的標籤從前面的 [0, 1, 2] 對象上撕下來,從新貼到 [3, 4, 5] 這個對象上。 

至始至終,並無一個叫作 values 的列表對象容器存在,Python 也沒有把任何對象的值複製進 values 去。過程如圖所示: 

執行

values[1] = values

的時候,Python 作的事情則是把 values 這個標籤所引用的列表對象的第二個元素指向 values 所引用的列表對象自己。執行完畢後,values 標籤仍是指向原來那個對象,只不過那個對象的結構發生了變化,從以前的列表 [0, 1, 2] 變成了 [0, ?, 2],而這個 ? 則是指向那個對象自己的一個引用。如圖所示: 
 
要達到你所須要的效果,即獲得 [0, [0, 1, 2], 2] 這個對象,你不能直接將 values[1] 指向 values 引用的對象自己,而是須要吧 [0, 1, 2] 這個對象「複製」一遍,獲得一個新對象,再將 values[1] 指向這個複製後的對象。Python 裏面複製對象的操做因對象類型而異,複製列表 values 的操做是

values[:] #生成對象的拷貝或者是複製序列,再也不是引用和共享變量,但此法只能頂層複製

因此你須要執行 

values[1] = values[:]

Python 作的事情是,先 dereference 獲得 values 所指向的對象 [0, 1, 2],而後執行 [0, 1, 2][:] 複製操做獲得一個新的對象,內容也是 [0, 1, 2],而後將 values 所指向的列表對象的第二個元素指向這個複製二來的列表對象,最終 values 指向的對象是 [0, [0, 1, 2], 2]。過程如圖所示: 

往更深處說,values[:] 複製操做是所謂的「淺複製」(shallow copy),當列表對象有嵌套的時候也會產生出乎意料的錯誤,好比

1 = [0, [12], 3]
2 = a[:]
3 a[0= 8
4 a[1][1= 9

問:此時 a 和 b 分別是多少? 

正確答案是 a 爲 [8, [1, 9], 3],b 爲 [0, [1, 9], 3]。發現沒?b 的第二個元素也被改變了。想一想是爲何?不明白的話看下圖 

正確的複製嵌套元素的方法是進行「深複製」(deep copy),方法是

1 import copy
2
3 = [0, [12], 3]
4 = copy.deepcopy(a)
5 a[0= 8
6 a[1][1= 9

二、引用 VS 拷貝:

(1)沒有限制條件的分片表達式(L[:])可以複製序列,但此法只能淺層複製

(2)字典 copy 方法,D.copy() 可以複製字典,但此法只能淺層複製

(3)有些內置函數,例如 list,可以生成拷貝 list(L)

(4)copy 標準庫模塊可以生成完整拷貝:deepcopy 本質上是遞歸 copy

(5)對於不可變對象和可變對象來講,淺複製都是複製的引用,只是由於複製不變對象和複製不變對象的引用是等效的(由於對象不可變,當改變時會新建對象從新賦值)。因此看起來淺複製只複製不可變對象(整數,實數,字符串等),對於可變對象,淺複製實際上是建立了一個對於該對象的引用,也就是說只是給同一個對象貼上了另外一個標籤而已。

01 = [123]
02 = {'a':1'b':2}
03 = L[:]
04 = D.copy()
05 print "L, D"
06 print  L, D
07 print "A, B"
08 print A, B
09 print "--------------------"
10 A[1= 'NI'
11 B['c'= 'spam'
12 print "L, D"
13 print  L, D
14 print "A, B"
15 print A, B
16
17
18 L, D
19 [123] {'a'1'b'2}
20 A, B
21 [123] {'a'1'b'2}
22 --------------------
23 L, D
24 [123] {'a'1'b'2}
25 A, B
26 [1'NI'3] {'a'1'c''spam''b'2}

三、增強賦值以及共享引用:

x = x + y,x 出現兩次,必須執行兩次,性能很差,合併必須新建對象 x,而後複製兩個列表合併

屬於複製/拷貝

x += y,x 只出現一次,也只會計算一次,性能好,不生成新對象,只在內存塊末尾增長元素。

當 x、y 爲list時, += 會自動調用 extend 方法進行合併運算,in-place change。

屬於共享引用

01 = [12]
02 = L
03 = + [34]
04 print L, M
05 print "-------------------"
06 = [12]
07 = L
08 += [34]
09 print L, M
10
11
12 [1234] [12]
13 -------------------
14 [1234] [1234]

四、python 從 2k 到 3k,語句變函數引起的變量做用域問題  

先看段代碼:

1 def test():
2     = False
3     exec ("a = True")
4     print ("a = ", a)
5 test()
6
7 = False
8 exec ("b = True")
9 print ("b = ", b)

在 python 2k 和 3k 下 你會發現他們的結果不同:

1 2K
2 =  True
3 =  True
4
5 3K
6 =  False
7 =  True

這是爲何呢?

由於 3k 中 exec 由語句變成函數了,而在函數中變量默認都是局部的,也就是說

你所見到的兩個 a,是兩個不一樣的變量,分別處於不一樣的命名空間中,而不會衝突。

具體參考 《learning python》P331-P332

知道緣由了,咱們能夠這麼改改:

01 def test():
02     = False
03     ldict = locals()
04     exec("a=True",globals(),ldict)
05     = ldict['a']
06     print(a)
07
08 test()
09
10 = False
11 exec("b = True"globals())
12 print("b = ", b)

這個問題在  stackoverflow 上已經有人問了,並且 python 官方也有人報了 bug。。。

具體連接在下面:

http://stackoverflow.com/questions/7668724/variables-declared-in-execed-code-dont-become-local-in-python-3-documentatio

http://bugs.python.org/issue4831

http://stackoverflow.com/questions/1463306/how-does-exec-work-with-locals

這是一個典型的 python 2k 移植到 3k 不兼容的案例,相似的還有不少,也算是移植的坑吧~

具體的 2k 與 3k 有哪些差別能夠看這裏:

使用 2to3 將代碼移植到 Python 3

http://woodpecker.org.cn/diveintopython3/porting-code-to-python-3-with-2to3.html


REF:

《learning python》:P130、P13四、P20二、P204 、P245

http://www.zhihu.com/question/21000872/answer/16856382

相關文章
相關標籤/搜索