Python 中的sys
模塊極爲基礎而重要,它主要提供了一些給解釋器使用(或由它維護)的變量,以及一些與解釋器強交互的函數。python
本文將會頻繁地使用該模塊的getsizeof()
方法,所以,我先簡要介紹一下:程序員
這裏有個直觀的例子:數據結構
import sys
a = [1, 2]
b = [a, a] # 即 [[1, 2], [1, 2]]
# a、b 都只有兩個元素,因此直接佔用的大小相等
sys.getsizeof(a) # 結果:80
sys.getsizeof(b) # 結果:80
複製代碼
上例說明了一件事:一個靜態建立的列表,若是隻包含兩個元素,那它自身佔用的內存就是 80 字節,無論其元素所指向的對象是什麼。app
好了,擁有這把測量工具,咱們就來探究一下 Python 的內置對象都藏了哪些小祕密吧。函數
對於咱們熟知的一些空對象,例如空字符串、空列表、空字典等等,不知道你們是否曾好奇過,是否曾思考過這些問題:空的對象是否是不佔用內存呢?若是佔內存,那佔用多少呢?爲何是這樣分配的呢?工具
直接上代碼吧,一塊兒來看看幾類基本數據結構的空對象的大小:spa
import sys
sys.getsizeof("") # 49
sys.getsizeof([]) # 64
sys.getsizeof(()) # 48
sys.getsizeof(set()) # 224
sys.getsizeof(dict()) # 240
# 做爲參照:
sys.getsizeof(1) # 28
sys.getsizeof(True) # 28
複製代碼
可見,雖然都是空對象,可是這些對象在內存分配上並不爲「空」,並且分配得還挺大(記住這幾個數字哦,後面會考)。code
排一下序:基礎數字<空元組 < 空字符串 < 空列表 < 空集合 < 空字典。cdn
這個小祕密該怎麼解釋呢?對象
由於這些空對象都是容器,咱們能夠抽象地理解:它們的一部份內存用於建立容器的骨架、記錄容器的信息(如引用計數、使用量信息等等)、還有一部份內存則是預分配的。
空對象並不爲空,一部分緣由是 Python 解釋器爲它們預分配了一些初始空間。在不超出初始內存的狀況下,每次新增元素,就使用已有內存,於是避免了再去申請新的內存。
那麼,若是初始內存被分配完以後,新的內存是怎麼分配的呢?
import sys
letters = "abcdefghijklmnopqrstuvwxyz"
a = []
for i in letters:
a.append(i)
print(f'{len(a)}, sys.getsizeof(a) = {sys.getsizeof(a)}')
b = set()
for j in letters:
b.add(j)
print(f'{len(b)}, sys.getsizeof(b) = {sys.getsizeof(b)}')
c = dict()
for k in letters:
c[k] = k
print(f'{len(c)}, sys.getsizeof(c) = {sys.getsizeof(c)}')
複製代碼
分別給三類可變對象添加 26 個元素,看看結果如何:
由此能看出可變對象在擴充時的祕密:
以上的可變對象在擴充時,有類似的分配機制,在動態擴容時可明顯看出效果。
那麼,靜態建立的對象是否也有這樣的分配機制呢?它跟動態擴容比,是否有所區別呢?
先看看集合與字典:
# 靜態建立對象
set_1 = {1, 2, 3, 4}
set_2 = {1, 2, 3, 4, 5}
dict_1 = {'a':1, 'b':2, 'c':3, 'd':4, 'e':5}
dict_2 = {'a':1, 'b':2, 'c':3, 'd':4, 'e':5, 'f':6}
sys.getsizeof(set_1) # 224
sys.getsizeof(set_2) # 736
sys.getsizeof(dict_1) # 240
sys.getsizeof(dict_2) # 368
複製代碼
看到這個結果,再對比上一節的截圖,能夠看出:在元素個數相等時,靜態建立的集合/字典所佔的內存跟動態擴容時徹底同樣。
這個結論是否適用於列表對象呢?一塊兒看看:
list_1 = ['a', 'b']
list_2 = ['a', 'b', 'c']
list_3 = ['a', 'b', 'c', 'd']
list_4 = ['a', 'b', 'c', 'd', 'e']
sys.getsizeof(list_1) # 80
sys.getsizeof(list_2) # 88
sys.getsizeof(list_3) # 96
sys.getsizeof(list_4) # 104
複製代碼
上一節的截圖顯示,列表在前 4 個元素時都佔 96 字節,在 5 個元素時佔 128 字節,與這裏明顯矛盾。
因此,這個祕密昭然若揭:在元素個數相等時,靜態建立的列表所佔的內存有可能小於動態擴容時的內存!
也就是說,這兩種列表看似相同,實際卻不一樣!列表不等於列表!
前面提到了,擴充可變對象時,可能會申請新的內存。
那麼,若是反過來縮減可變對象,減掉一些元素後,新申請的內存是否會自動回收掉呢?
import sys
a = [1, 2, 3, 4]
sys.getsizeof(a) # 初始值:96
a.append(5) # 擴充後:[1, 2, 3, 4, 5]
sys.getsizeof(a) # 擴充後:128
a.pop() # 縮減後:[1, 2, 3, 4]
sys.getsizeof(a) # 縮減後:128
複製代碼
如代碼所示,列表在一擴一縮後,雖然回到了原樣,可是所佔用的內存空間可沒有自動釋放啊。其它的可變對象同理。
這就是 Python 的小祕密了,「胖子沒法減重原理」 :瘦子變胖容易,縮減身型也容易,可是體重減不掉,哈哈~~~
使用 pop() 方法,只會縮減可變對象中的元素,但並不會釋放已申請的內存空間。
還有個 clear() 方法,它會清空可變對象的全部元素,讓咱們試試看吧:
import sys
a = [1, 2, 3]
b = {1, 2, 3}
c = {'a':1, 'b':2, 'c':3}
sys.getsizeof(a) # 88
sys.getsizeof(b) # 224
sys.getsizeof(c) # 240
a.clear() # 清空後:[]
b.clear() # 清空後:set()
c.clear() # 清空後:{},也即 dict()
複製代碼
調用 clear() 方法,咱們就得到了幾個空對象。
在第一小節裏,它們的內存大小已經被查驗過了。(前面說過會考的,請默寫 回看下)
可是,若是這時再去查驗的話,你會驚訝地發現,這些空對象的大小跟前面查的並不徹底同樣!
# 承接前面的清空操做:
sys.getsizeof(a) # 64
sys.getsizeof(b) # 224
sys.getsizeof(c) # 72
複製代碼
空列表與空元組的大小不變,然而空字典(72)居然比前面的空字典(240)要小不少!
也就是說,列表與元組在清空元素後,回到起點不變初心,然而,字典這傢伙倒是「賠了夫人又折兵」,不只把「吃」進去的全吐出來了,還把本身的老本給虧掉了!
字典的這個祕密藏得挺深的,說實話我也是剛剛獲知,百思不得其解……
以上就是 Python 在分配內存時的幾個小祕密啦,看完以後,你是否以爲漲見識了呢?
你想明白了幾個呢,又產生了多少新的謎團呢?歡迎留言一塊兒交流哦~
對於那些沒有充分解釋的小祕密,從此咱們再慢慢揭祕……
做者簡介: 豌豆花下貓,生於廣東畢業於武大,現爲蘇漂程序員,有一些極客思惟,也有一些人文情懷,有一些溫度,還有一些態度。公衆號:「Python貓」(python_cat)