目錄
1、理解垃圾回收平臺的基本工做原理
- 值類型(含全部枚舉類型)、集合類型、String、Attribute、Delegate和Event所表明的資源無需執行特殊的清理操做。
- 若是一個類型表明着或包裝着一個非託管資源或者本地資源(好比數據庫鏈接、套接字、mutex、位圖等),那麼在對象的內存準備回收時,必須執行資源清理代碼。
- CLR要求全部的資源都從託管堆分配。
- 進程初始化時,CLR要保留一塊連續的地址空間,這個地址空間最初沒有對應的物理存儲空間。這個地址空間就是託管堆。託管堆還維護着一個指針,能夠稱爲NextObjPtr。它指向下一個對象在堆中的分配位置。剛開始時,NextObjPtr設爲保留地址空間的基地址。IL指令使用newobj建立一個對象。newobj指令將致使CLR執行如下步驟:
- 計算類型(及其全部基類型)所須要的字節數。
-
加上對象的額外開銷的字節數——「類型對象指針」和「同步塊索引」。
- CLR檢查保留區域是否能分配出相應的字節數。若是託管堆有足夠的可用空間,對象將被放入。注意對象這在NextObjPtr指針指向的地址放入的,而且爲它分配的字節會被清零。接着,調用類型的實例構造函數(爲this參數傳遞NextObjPtr),IL指令newobj將返回對象的地址。就在地址返回以前,NextObjPtr指針的值會加上對象佔據的字節數,這樣就會獲得一個新的NextObjPtr值,它指向下一個對象放入托管堆時的地址。
- 託管堆之因此能這麼作,是由於它作了一個至關大膽的假設——地址空間和存儲是無限的。這個假設顯然是荒謬的。因此,託管堆必須經過某種機制來容許它作這樣的假設。這種機制就是垃圾回收。
- 對象不斷的被建立,NextObjPtr也在不斷的增長,若是NextObjPtr超過了地址空間的末尾,代表託管堆已滿,就必須強制執行一次垃圾回收。
2、 垃圾回收算法
- 每一個應用程序都包含一組根。每一個根都是一個存儲位置,其中包含指向引用類型對象的指針。該指針要麼引用託管堆中的一個對象,要麼爲null。只有引用類型的變量纔會被認爲是根;值類型的變量永遠不被認爲是根。
- 垃圾回收開始執行時,它假設堆中全部對象都是垃圾。
- 第一個階段爲標記階段。這個階段,垃圾回收器沿着線程棧向上檢查全部根。若是發現一個根引用了一個對象,就進行」標記」。該標記具備傳遞性。標記好根和它的字段引用的對象以後,垃圾回收器會檢查下一個根,並繼續標記對象。若是垃圾回收期試圖標記先前已經標記了的根,就會中止沿着這個路徑走下去。檢查好全部根以後,堆中將包含一組已標記和未標記的對象。已標記的對象是經過應用程序的代碼能夠到達的對象,而未標記的對象是不可達的。不可達的對象就是垃圾,它們的內存是能夠回收的。
- 第二個階段爲壓縮(能夠理解成"內存碎片整理")階段。在這個階段中,垃圾回收器線性遍歷堆,以尋找未標記對象的連續內存塊。若是這個內存塊較小,垃圾回收器會忽略它們。反之,垃圾回收器會把非垃圾的對象移動到這裏已壓縮堆,其實在這是內存碎片整理或許更會適用。天然的,包含那些」指向這些對象的指針」的變量和CPU寄存器如今都會變得無效。因此,垃圾回收器必須從新訪問應用程序的全部根,並修改它們來指向對象的新內存位置。堆內存壓縮以後,託管堆的NextObjPtr指針將指向緊接在最後一個非垃圾回收對象以後的位置。
- 因此,垃圾回收器會形成顯著的損失,這是使用託管堆的主要缺點。固然,垃圾回收只在第0代滿的時候纔會發生。在此以前,託管堆性能遠遠高於C運行時堆。
3、垃圾回收與調試
- 當JIT編譯器將方法的IL代碼編譯成本地代碼時,JIT編譯器會檢查兩點:定義方法的程序集在編譯時沒有優化;進行當前在一個調試器中執行。若是這兩點都成立,JIT編譯器在生成方法的內部根表時,會將變量的生存期手動延長至方法結束。
4、使用終結操做來釋放本地資源
- 終結是CLR提供的一種機制,容許對象在垃圾回收器回收其內存以前執行一些得體的清理工做。
- 任何包裝了本地資源的類型都必須支持終結操做。簡單的說,類型實現了一個命名爲Finalize的方法。當垃圾回收期判斷一個對象是垃圾時,會調用對象的Finalize方法。
- C#團隊認爲,Finalize方法是編程語言中須要特殊語法的一種方法。在C#中,必須在類名前加一個~符號來定義Finalize方法。
Internal sealed class SomeType {
~SomeType(){
//這裏的代碼會進入Finalize方法
}
}
5. 編譯上述代碼,會發現C#編譯器實際是在模塊的元數據中生成一個名爲Finalize的protected override方法。方法主體被放到try塊中,finally塊放入了一個對base.Finalize的調用。
6.實現Finalize方法時,通常都會調用Win32 CloseHandle函數,並向該函數傳遞本地資源的句柄。
5、對託管資源使用終結操做
- 永遠不要對託管資源使用終結操做,這是有一種很是好的編程習慣。由於對託管資源使用終結操做是一種很是高級的編碼方式,只有極少數狀況下才會用到。
- 設計一個類型時,處於如下幾個性能緣由,應避免使用Finalize方法:
- 可終結的對象要花費更長的時間來分配,由於指向它們的指針必須先放到終結列表中。("終結列表"在第七節會說到)
- 可終結對象會被提高到較老的一代,這會增長內存壓力,並在垃圾回收器斷定爲垃圾時,阻止回收。除此以外,對該對象直接或間接引用的對象都會提高到較老的一代。("代"在第十三節會說到)
- 可終結的對象會致使應用程序運行緩慢,由於每一個對象在進行回收時,須要對它們進行額外操做。
- 咱們沒法控制Finalize方法什麼時候運行。CLR不保證各個Finalize的調用順序。
6、是什麼致使Finalize方法被調用
- 第0代滿 只有第0代滿時,垃圾回收器會自動開始。該事件是目前致使調用Finalize方法最多見的一種方式。("代"在第十三節會說到)
- 代碼顯式調用System.GC的靜態方法Collect 代碼能夠顯式請求CLR執行即時垃圾回收操做。
- Windows內存不足 當Windows報告內存不足時,CLR會強制執行垃圾回收。
- CLR卸載AppDomain 一個ApppDomain被卸載時,CLR認爲該AppDomain不存在任何根,所以會對全部代的對象執行垃圾回收。
- CLR關閉 一個進程結束時,CLR就會關閉。CLR關閉會認爲進程中不存在 任何根,所以會調用託管堆中全部的Finalize方法,最後由Windows回收內存。
7、終結操做揭祕
- 應用程序建立一個新對象時,new操做符會從堆中分配內存。若是對象的類型定義了Finalize方法,那麼在該類型的實例構造器調用以前,會將一個指向該對象的指針放到一個終結列表(finalization list)中。
- 終結列表是由垃圾回收器控制的一個內部數據結構。列表中的每一項都指向一個對象,在回收該對象以前,會先調用對象的Finalize方法。
- 下圖1展現了包含幾個對象的一個託管堆。有的對象從應用程序的根可達,有的不可達(垃圾)。對象C,E,F,I,J被建立時,系統檢測到這些對象的類型定義來了Finalize方法,全部指向這些對象的指針要添加到終結列表中。
- 垃圾回收開始時,對象B,E,G,H,I和J被斷定爲垃圾。垃圾回收器掃描終結列表以查找指向這些對象的指針。找到一個指針後,該指針會從終結列表中移除,並追加到freachable隊列中。freachable隊列(發音是「F-reachable」)是垃圾回收器的內部數據結構。Freachable隊列中的每一個指針都表明其Finalize方法已準備好調用的一個對象。圖2展現了回收完畢後託管堆的狀況。
- 從圖2中咱們能夠看出B,E和H已經從託管堆中回收了,由於它們沒有Finalize方法,而E,I,J則暫時沒有被回收,由於它們的Finalize方法還未調用。
- 一個特殊的高優先級的CLR線程負責調用Finalize方法。使用專用的線程可避免潛在的線程同步問題。freachable隊列爲空時,該線程將睡眠。當隊列中有記錄項時,該線程就會被喚醒,將每一項從freachable隊列中移除,並調用每一項的 Finalize方法。
- 若是一個對象在freachable隊列中,那麼意味這該對象是可達的,不是垃圾。
- 本來,當對象不可達時,垃圾回收器將把該對象當成垃圾回收了,但是當對象進入freachable隊列時,有奇蹟般的」復活」了。而後,垃圾回收器壓縮(內存脆片整理)可回收的內存,特殊的CLR線程將清空freachable隊列,並調用其中每一個對象的Finalize方法。
- 垃圾回收器下一次回收時,發現已終結的對象成爲真正的垃圾,由於應用程序的根再也不指向它,freachhable隊列也再也不指向它。因此,這些對象的內存會直接回收。
- 整個過程當中,可終結對象須要執行兩次垃圾回收器才能釋放它們佔用的內存。可在實際開發中,因爲對象可能被提高到較老的一代,因此可能要求不止兩次進行垃圾回收。圖3展現了第二次垃圾回收後託管堆中的狀況。
8、Dispose模式:強制對象清理資源
- Finalize方法很是有用,由於它確保了當託管對象的內存被釋放時,本地資源不會泄漏。可是,Finalize方法的問題在於,他的調用時間不能保證。另外,因爲他不是公共方法,因此類的用戶不能顯式調用它。
- 類型爲了提供顯式進行資源清理的能力,提供了Dispose模式。
- 全部定義了Finalize方法的類型都應該同時實現Dispose模式,使類型的用戶對資源的生存期有更多的控制。
9、使用實現了Dispose模式的類型
- 調用Dispose或Close只是爲了能在一個肯定的時間強迫對象執行清理;這兩個方法並不能控制託管堆中的對象所佔用的內存的生存期。這意味着即便一個對象已完成了清理,仍然可在它上面調用方法,但會拋出ObjectDisposedException異常。
- 建議只有在如下兩種狀況下才調用Dispose或Close:
- a) 肯定必須清理資源
- b) 肯定能夠安全的調用Dispose或Close,並但願將對象從終結列表中刪除,禁止對象提高到下一代,從而提高性能。
10、C#的using語句
- 若是決定顯式地調用Dispose和Close這兩個方法之一,強烈建議把它們放到一個異常處理finally中。這樣能夠保證清理代碼獲得執行。
- Using語句就是一種對第1點進行簡化的語法。
11、手動監視和控制對象的生存期
- CLR爲每個AppDomain都提供了一個GC句柄表。該表容許應用程序監視對象的生存期,或手動控制對象的生存期。
- 在一個AppDomain建立之初,該句柄表是空的。句柄表中的每一個記錄項都包含如下兩種信息:一個指針,它指向託管堆上的一個對象;一個標誌(flag),它指出你想如何監視或控制對象。
- 爲了在這個表中添加或刪除記錄項,應用程序要使用以下所示的System.Runtime.InteropServices.GCHandle類型。
12、對象復活
- 前面說過,須要終結的一個對象被認爲死亡時,垃圾回收器會強制是該對象重生,使它的Finalize方法得以調用。Finalize方法調用以後,對象才真正的死亡。
- 須要終結的一個對象會經歷死亡、重生、在死亡的」三部曲」。一個死亡的對象重生的過程稱爲重生。
- 復活通常不是一件好事,應避免寫代碼來利用CLR這個」功能」。
十3、代
- 代是CLR垃圾回收器採用的一種機制,它惟一的目的就是提高應用程序的性能。
- 一個基於代的垃圾回收器作出瞭如下幾點假設:
- 對象越新,生存期越短。
- 對象越老,生存期越長。
- 回收堆的一部分,速度快於回收整個堆。
- 代的工做原理:
- 託管堆在初始化時不包含任何對象。添加到堆的對象稱爲第0代對象。第0代對象就是那些新構造的對象,垃圾回收器從未檢查過它們。圖4展現了一個新啓動的應用程序,它分配了5個對象。過會兒,對象C和E將變得不可達。
- CLR初始化時,它會爲第0代對象選擇一個預算容量,假定爲256K(實際容量可能有所不一樣)。因此,若是分配一個新對象形成第0代超過預算,就必須啓動一次垃圾回收。假定對象A到E恰好佔用256K內存。對象F分配時,垃圾回收器必須啓動。垃圾回收器斷定對象C和E爲垃圾,由於會壓縮(內存碎片整理)對象D,使其與對象B相鄰。之因此第0代的預算容量爲256K,是由於全部這些對象都能裝入CPU的L2緩存,使之壓縮(內存碎片整理)能以很是快的速度完成。在垃圾回收中存活的對象(A、B和D)被認爲是第1代對象。第1代對象已經經歷垃圾回收的一次檢查。此時的對如圖5所示。
- 一次垃圾回收後,第0代就不包含任何對象了。和前面同樣,新對象會分配到第0代中。在圖6中,應用程序繼續運行,並新分配了對象F到對象K。另外,隨着應用程序繼續運行,對象B、H和J變得不可達,它們的內存將在某一個回收。
- 如今,假定分配新對象L會形成第0代超過256KB的預算。因爲第0代達到預算,因此必須啓動垃圾回收器。開始一次垃圾回收時,垃圾回收器必須決定檢查哪些代。
- 前面說過,當CLR初始化時,他爲第0代對象選擇了一個預算。一樣的,它還必須爲第1代選擇一個預算。假定爲第1代選擇的預算爲2MB。
- 垃圾回收開始時,垃圾回收器還會檢查第1代佔據了多少內存。因爲在本例中。第一代佔據的內存遠遠小於2MB,因此垃圾回收器只檢查第0代。由於此時垃圾回收器只檢查第0代,忽略第1代,因此大大加快了垃圾回收器的速度。可是,對性能最大的提高就是如今沒必要遍歷整個託管堆。若是一個對象引用了一個老對象,垃圾回收器就能夠忽略那個老對象的全部內部引用,從而能更快的構造好可達對象的圖。
- 如圖7所示,全部倖存下來的第0代對象變成了第1代的一部分。因爲垃圾回收器沒有檢查第1代,因此對象B的內存並無被回收,即便它在上次垃圾回收時變得不可達。在一次垃圾回收後,第0代不包含任何對象,等着分配新對象。
- 假定程序繼續運行,並分配對象L到對象O。另外,在運行過程當中,應用程序中止使用對象G,I,M,是它們變得不可達。此時的託管堆如圖8所示。
- 假設分配對象P致使第0代超過預算,垃圾回收發生。因爲第1代中全部對象佔據的內存仍小於2MB,因此垃圾回收器再次決定只回收第0代,忽略第1代不可達的垃圾(對象B和G)。回收後,堆的狀況如圖9所示。
- 從圖9中能夠看到,第1代正在緩慢增加。假定第1代的增加致使它全部對象佔據的內存恰好達到2MB。這時,隨着應用程序的運行,並分配了對象P到對S,使第0代對象達到了它的預算容量。這是的堆如圖10所示。
- 應用程序試圖分配對象T時,因爲第0代已滿,因此必須開始垃圾回收。可是,此次垃圾回收器發現第1代佔據的內存超過了2MB。因此垃圾回收器此次決定檢查第1代和第0代中的全部對象。兩代都被回收以後,託管堆狀況如圖11所示。
4. 像前面同樣,垃圾回收後,第0代的倖存者被提高到了第1代,第1代的倖存者被提高到了第2代,第0代再次空出來,準備迎接新對象的到來。第2代中的對象會通過2次或更屢次的檢查。只有在第1代到達預算容量是纔會檢查第1代中的對象。而對此以前,通常已經對第0代進行了好幾回垃圾回收。
5. CLR的託管堆只支持三代:第0代、第1代和第2代。第0代的預算約爲256KB,第1代的預算約爲2MB,第2代的預算容量約爲10MB。
十4、 線程劫持
- 前面討論的垃圾回收算法有一個很大的前提就是:只在一個線程運行。
- 在現實開發中,常常會出現多個線程同時訪問託管堆的狀況,或至少會有多個線程同時操做堆中的對象。一個線程引起垃圾回收時,其它線程絕對不能訪問任何線程,由於垃圾回收器可能移動這些對象,更改它們的內存位置。
- CLR想要進行垃圾回收時,會當即掛起執行託管代碼中的全部線程,正在執行非託管代碼的線程不會掛起。而後,CLR檢查每一個線程的指令指針,判斷線程指向到哪裏。接着,指令指針與JIT生成的表進行比較,判斷線程正在執行什麼代碼。
- 若是線程的指令指針剛好在一個表中標記好的偏移位置,就說明該線程抵達了一個安全點。線程可在安全點安全地掛起,直至垃圾回收結束。若是線程指令指針不在表中標記的偏移位置,則代表該線程不在安全點,CLR也就不會開始垃圾回收。在這種狀況下,CLR就會劫持該線程。也就是說,CLR會修改該線程棧,使該線程指向一個CLR內部的一個特殊函數。而後,線程恢復執行。當前的方法執行完後,他就會執行這個特殊函數,這個特殊函數會將該線程安全地掛起。
- 然而,線程有時長時間執行當前所在方法。因此,當線程恢復執行後,大約有250毫秒的時間嘗試劫持線程。過了這個時間,CLR會再次掛起線程,並檢查該線程的指令指針。若是線程已抵達一個安全點,垃圾回收就能夠開始了。可是,若是線程尚未抵達一個安全點,CLR就檢查是否調用了另外一個方法。若是是,CLR再一次修改線程棧,以便從最近執行的一個方法返回以後劫持線程。而後,CLR恢復線程,進行下一次劫持嘗試。
- 全部線程都抵達安全點或被劫持以後,垃圾回收才能使用。垃圾回收完以後,全部線程都會恢復,應用程序繼續運行,被劫持的線程返回最初調用它們的方法。
- 實際應用中,CLR大多數時候都是經過劫持線程來掛起線程,而不是根據JIT生成的表來判斷線程是否到達了一個安全點。之因此如此,緣由是JIT生成表須要大量內存,會增大工做集,進而嚴重影響性能。
十5、大對象
- 任何85000字節或更大的對象都被自動視爲大對象。
- 大對象從一個特殊的大對象堆中分配。這個堆中採起和前面小對象同樣的方式終結和釋放。可是,大對象永遠不壓縮(內存碎片整理),由於在堆中下移850000字節的內存塊會浪費太多CPU時間。
- 大對象老是被認爲是第2代的一部分,因此只能爲須要長時間存活的資源建立大對象。若是分配短期存活的大對象,將致使第2代被更頻繁地回收,進而會損害性能。