[TOC]python
咱們定義變量會申請內存空間來存放變量的值,而內存的容量是有限的,當一個變量值沒有用了(稱爲垃圾),就應該將其佔用的內存給回收掉。變量名是訪問到變量的惟一方式,因此當一個變量值沒有任何關聯的變量名時,咱們就沒法訪問到該變量了,該變量就是一個垃圾,會被python解釋的垃圾回收機制自動回收。程序員
垃圾回收機制(簡稱GC)是python解釋器自帶的一種機制,專門用來回收不可用的變量值所佔用的內存空間app
程序運行過程當中會申請大量的內存空間,而對於一些無用的內存空間,若是不及時清理的話,會致使內存使用完(內存溢出),致使程序崩潰,所以,內存管理是一件重要且繁雜的事情,而python解釋器自帶的垃圾回收機制把程序員從繁雜的內存管理中解放出來。spa
python的GC模塊主要採用了‘引用計數’來跟蹤和回收垃圾。在引用計數的基礎上,還能夠經過‘標記-清除’來解決容器對象可能產生的循環引用的問題,而且經過‘分代回收’來以空間換取時間的方式進一步提升垃圾回收的效率。線程
引用計數就是:變量值被變量名關聯的次數code
如:對象
引用計數增長blog
x=10(此時,變量值10的引用次數爲1)內存
y=x(此時,把x的內存地址給了y,此時,變量值10 的引用計數爲2)內存管理
引用計數減小
x=3(此時,x和10解除關係,與3創建關係,變量值10的引用計數爲1)
del y(del是解除變量名y與變量值10之間的關係,變量值10的引用計數爲0),變量值10的引用計數爲0,其佔用的內存空間就會被回收
引用計數機制執行效率問題:變量值被關聯次數的增長或減小,都會引起引用計數機制的執行,這明顯存在效率問題,這就是引用計數的一個軟肋,但引用計數還存在一個致命弱點,即循環引用(也稱交叉引用)。
# 變量名l1指向列表1,變量名l2指向列表2,以下 >>> l1=['列表1中的第一個元素'] # 列表1被引用一次 >>> l2=['列表2中的第一個元素'] # 列表2被引用一次 >>> l1.append(l2) # 把列表2追加到l1中做爲第二個元素,列表2的引用計數爲2 >>> l2.append(l1) # 把列表1追加到l2中做爲第二個元素,列表1的引用計數爲2 # l1與l2 del l1 #列表1的引用計數爲1del l2 #列表2的引用計數爲1
如今列表1和列表2都沒被其餘變量名關聯,但引用計數不爲0,因此不會被回收,這就是循環引用的危害,爲解決這問題,python引進了‘標記-清除’,‘分代回收’。
容器對象(list,set,dict,class,instance)均可以包含其餘對象的引用,因此均可能產生循環引用。在瞭解‘標記-清除’以前,先得知道一個知識點:內存中有兩塊區域:堆區與棧區,在定義變量時,變量名放在棧區,變量值放在堆區,內存管理是對堆區的管理。
當有效內存空間被耗盡的時候,就會中止整個程序,而後進行兩項工做,第一是標記,第二是清除
標記:遍歷全部的GC Roots對象(棧區中的全部內容或者線程均可以做爲GC Roots對象),而後將全部GC Roots對象能夠直接訪問或間接訪問的對象標記爲存活對象。
清除:遍歷堆區中全部的對象,將沒有標記的對象所有清除
基於引用計數的回收機制,每次回收內存,須要把全部的對象的引用計數都遍歷一遍,這是很是耗費時間的,因而引入分代回收提升回收效率,採用‘空間換取時間的策略’。
分代:在屢次掃描的狀況下,都沒有被回收的變量值,GC機制會認爲,該變量值的級別會增高,對其掃描的頻率會下降。
分代指的是根據存活時間來劃分變量值的等級(也就是不一樣的代)
新定義的變量值,會放在新生代中,假設每隔1分鐘掃描一次,若是發現變量值依然存活,那該變量值的等級會提升,當權重大於3(假設爲3),會放到青春代中,每隔5分鐘掃描一次,繼續存活下去,權重繼續增高,當權重大於10(假設爲10),會被放到老年代中,次時每隔10分鐘掃描一次,以此類推。等級越高,被垃圾回收掃描的頻率越低。
回收:依然是引用計數做爲回收依據