棧和堆

1、預備知識—程序的內存分配 一個由C/C++編譯的程序佔用的內存分爲如下幾個部分 一、棧區(stack)— 由編譯器自動分配釋放 ,存放函數的參數值,局部變量的值等。其 操做方式相似於數據結構中的棧。 二、堆區(heap) — 通常由程序員分配釋放, 若程序員不釋放,程序結束時可能由OS回 收 。注意它與數據結構中的堆是兩回事,分配方式卻是相似於鏈表,呵呵。 三、全局區(靜態區)(static)—,全局變量和靜態變量的存儲是放在一塊的,初始化的 全局變量和靜態變量在一塊區域, 未初始化的全局變量和未初始化的靜態變量在相鄰的另 一塊區域。 - 程序結束後由系統釋放。 四、文字常量區 —常量字符串就是放在這裏的。 程序結束後由系統釋放 五、程序代碼區—存放函數體的二進制代碼。程序員

2、例子程序   
這是一個前輩寫的,很是詳細   
//main.cpp   
int a = 0; 全局初始化區   
char *p1; 全局未初始化區   
main()   
{   
int b; 棧   
char s[] = "abc"; 棧   
char *p2; 棧   
char *p3 = "123456"; 123456/0在常量區,p3在棧上。   
static int c =0; 全局(靜態)初始化區   
p1 = (char *)malloc(10);   
p2 = (char *)malloc(20);   
分配得來得10和20字節的區域就在堆區。   
strcpy(p1, "123456"); 123456/0放在常量區,編譯器可能會將它與p3所指向的"123456"  
優化成一個地方。   
}   
    
    
2、堆和棧的理論知識   
2.1申請方式   
stack:   
由系統自動分配。 例如,聲明在函數中一個局部變量 int b; 系統自動在棧中爲b開闢空  
間   
heap:   
須要程序員本身申請,並指明大小,在c中malloc函數   
如p1 = (char *)malloc(10);   
在C++中用new運算符   
如p2 = new char[10];   
可是注意p一、p2自己是在棧中的。   
    
    
2.2   
申請後系統的響應   
棧:只要棧的剩餘空間大於所申請空間,系統將爲程序提供內存,不然將報異常提示棧溢  
出。   
堆:首先應該知道操做系統有一個記錄空閒內存地址的鏈表,當系統收到程序的申請時,  
會遍歷該鏈表,尋找第一個空間大於所申請空間的堆結點,而後將該結點從空閒結點鏈表  
中刪除,並將該結點的空間分配給程序,另外,對於大多數系統,會在這塊內存空間中的  
首地址處記錄本次分配的大小,這樣,代碼中的delete語句才能正確的釋放本內存空間。  
另外,因爲找到的堆結點的大小不必定正好等於申請的大小,系統會自動的將多餘的那部  
分從新放入空閒鏈表中。   
    
2.3申請大小的限制   
棧:在Windows下,棧是向低地址擴展的數據結構,是一塊連續的內存的區域。這句話的意  
思是棧頂的地址和棧的最大容量是系統預先規定好的,在WINDOWS下,棧的大小是2M(也有  
的說是1M,總之是一個編譯時就肯定的常數),若是申請的空間超過棧的剩餘空間時,將  
提示overflow。所以,能從棧得到的空間較小。   
堆:堆是向高地址擴展的數據結構,是不連續的內存區域。這是因爲系統是用鏈表來存儲  
的空閒內存地址的,天然是不連續的,而鏈表的遍歷方向是由低地址向高地址。堆的大小  
受限於計算機系統中有效的虛擬內存。因而可知,堆得到的空間比較靈活,也比較大。   
    
    
    
2.4申請效率的比較:   
棧由系統自動分配,速度較快。但程序員是沒法控制的。   
堆是由new分配的內存,通常速度比較慢,並且容易產生內存碎片,不過用起來最方便.   
另外,在WINDOWS下,最好的方式是用VirtualAlloc分配內存,他不是在堆,也不是在棧是  
直接在進程的地址空間中保留一塊內存,雖然用起來最不方便。可是速度快,也最靈活。  
    
    
2.5堆和棧中的存儲內容   
棧: 在函數調用時,第一個進棧的是主函數中後的下一條指令(函數調用語句的下一條可  
執行語句)的地址,而後是函數的各個參數,在大多數的C編譯器中,參數是由右往左入棧  
的,而後是函數中的局部變量。注意靜態變量是不入棧的。   
當本次函數調用結束後,局部變量先出棧,而後是參數,最後棧頂指針指向最開始存的地  
址,也就是主函數中的下一條指令,程序由該點繼續運行。   
堆:通常是在堆的頭部用一個字節存放堆的大小。堆中的具體內容由程序員安排。   
    
2.6存取效率的比較   
    
char s1[] = "aaaaaaaaaaaaaaa";   
char *s2 = "bbbbbbbbbbbbbbbbb";   
aaaaaaaaaaa是在運行時刻賦值的;   
而bbbbbbbbbbb是在編譯時就肯定的;   
可是,在之後的存取中,在棧上的數組比指針所指向的字符串(例如堆)快。   
好比:   
#include   
void main()   
{   
char a = 1;   
char c[] = "1234567890";   
char *p ="1234567890";   
a = c[1];   
a = p[1];   
return;   
}   
對應的彙編代碼   
10: a = c[1];   
00401067 8A 4D F1 mov cl,byte ptr [ebp-0Fh]   
0040106A 88 4D FC mov byte ptr [ebp-4],cl   
11: a = p[1];   
0040106D 8B 55 EC mov edx,dword ptr [ebp-14h]   
00401070 8A 42 01 mov al,byte ptr [edx+1]   
00401073 88 45 FC mov byte ptr [ebp-4],al   
第一種在讀取時直接就把字符串中的元素讀到寄存器cl中,而第二種則要先把指針值讀到  
edx中,再根據edx讀取字符,顯然慢了。   
    
    
2.7小結:   
堆和棧的區別能夠用以下的比喻來看出:   
使用棧就象咱們去飯館裏吃飯,只管點菜(發出申請)、付錢、和吃(使用),吃飽了就  
走,沒必要理會切菜、洗菜等準備工做和洗碗、刷鍋等掃尾工做,他的好處是快捷,可是自  
由度小。   
使用堆就象是本身動手作喜歡吃的菜餚,比較麻煩,可是比較符合本身的口味,並且自由  
度大。算法

 

 

線程堆棧:簡稱棧 Stack
託管堆: 簡稱堆 Heap數組

使用.Net框架開發程序的時候,咱們無需關心內存分配問題,由於有GC這個大管家給咱們料理一切。若是咱們寫出以下兩段代碼:
代碼段1:數據結構

public int AddFive(int pValue)
           {
                int result;
                 result = pValue + 5;
                return result;
           }


代碼段2:框架

public class MyInt
           {         
             public int MyValue;
           }

          public MyInt AddFive(int pValue)
           {
                 MyInt result = new MyInt();
                 result.MyValue = pValue + 5;
                return result;
           }

 

問題1:你知道代碼段1在執行的時候,pValue和result在內存中是如何存放,生命週期又如何?代碼段2呢?
要想釋疑以上問題,咱們就應該對.Net下的棧(Stack)和託管堆(Heap)(簡稱堆)有個清楚認識,本立而道生。若是你想提升程序性能,理解棧和堆,必須的!
本文就從棧和堆,類型變量展開,對咱們寫的程序進行庖丁解牛。
C#程序在CLR上運行的時候,內存從邏輯上劃分兩大塊:棧,堆。這倆基本元素組成咱們C#程序的運行環境。函數

一,棧 vs 堆:區別?性能

        棧一般保存着咱們代碼執行的步驟,如在代碼段1中 AddFive()方法,int pValue變量,int result變量等等。而堆上存放的則可能是對象,數據等。(譯者注:忽略編譯器優化)咱們能夠把棧想象成一個接着一個疊放在一塊兒的盒子。當咱們使用的時候,每次從最頂部取走一個盒子。棧也是如此,當一個方法(或類型)被調用完成的時候,就從棧頂取走(called a Frame,譯註:調用幀),接着下一個。堆則否則,像是一個倉庫,儲存着咱們使用的各類對象等信息,跟棧不一樣的是他們被調用完畢不會當即被清理掉。優化

如圖1,棧與堆示意圖ui

(圖1)操作系統

棧內存無需咱們管理,也不受GC管理。當棧頂元素使用完畢,立馬釋放。而堆則須要GC(Garbage collection:垃圾收集器)清理。


二,什麼元素被分配到棧?什麼被分配到堆?

當咱們程序執行的時候,在棧和堆中分配有四種主要的類型:值類型,引用類型,指針,指令。

值類型:
在C#中,繼承自System.ValueType的類型被稱爲值類型,主要有如下幾種(CLR2.0中支持類型有增長):
    * bool
    * byte
    * char
    * decimal
    * double
    * enum
    * float
    * int
    * long
    * sbyte
    * short
    * struct
    * uint
    * ulong
    * ushort

引用類型:
如下是引用類型,繼承自System.Object:
    * class
    * interface
    * delegate
    * object
    * string

指針:
在內存區中,指向一個類型的引用,一般被稱爲「指針」,它是受CLR( Common Language Runtime:公共語言運行時)管理,咱們不能顯示使用。須要注意的是,一個類型的引用即指針跟引用類型是兩個徹底不一樣的概念。指針在內存中佔一塊內存區,它自己只表明一個內存地址(或者null),它所指向的另外一塊內存區纔是咱們真正的數據或者類型。如圖2:


(圖2)

指令:
後文對指令再作介紹。

三,如何分配?
咱們先看一下兩個觀點:
觀點1,引用類型老是被分配在堆上。(正確?)
觀點2,值類型和指針老是分配在被定義的地方,他們不必定被分配到棧上。(這個理解起來有點難度,須要慢慢來)

上文說起的棧(Stack),在程序運行的時候,每一個線程(Thread)都會維護一個本身的專屬線程堆棧。
當一個方法被調用的時候,主線程開始在所屬程序集的元數據中,查找被調用方法,而後經過JIT即時編譯並把結果(通常是本地CPU指令)放在棧頂。CPU經過總線從棧頂取指令,驅動程序以執行下去。

下面咱們以實例來詳談。

仍是咱們開篇所列的代碼段1:

  public int AddFive(int pValue)
           {
                int result;
                 result = pValue + 5;
                return result;
           }

       

當AddFive方法開始執行的時候,方法參數(parameters)則在棧上分配。如圖3:

(圖3)

注意:方法並不在棧中存活,圖示僅供參考。
接着,指令指向AddFive方法內部,若是該方法是第一次執行,首先要進行JIT即時編譯。如圖4:


(圖4)

當方法內部開始執行的時候,變量result被分配在棧上,如圖5:


(圖5)

方法執行完畢,並且方法返回後,如圖6所示:

(圖6)

在方法執行完畢返回後,棧上的區域被清理。如圖7:

(圖7)

以上看出,一個值類型變量,通常會分配在棧上。那觀點2中所述又作何理解?「值類型和指針老是分配在被定義的地方,他們不必定被分配到棧上」。
緣由就是若是一個值類型被聲明在一個方法體外而且在一個引用類型中,那它就會在堆上進行分配。
仍是代碼段2:

public class MyInt
           {         
             public int MyValue;
           }

          public MyInt AddFive(int pValue)
           {
                 MyInt result = new MyInt();
                 result.MyValue = pValue + 5;
                return result;
           }

 

當線程開始執行AddFive方法的時候,參數被分配到棧上,如圖8所示:

(圖8)
因爲MyInt是一個引用類型,因此它被分配到堆上,而且在棧中生成一個指針(result),如圖9:

(圖9)
AddFive方法執行完畢時的狀況如圖10:

(圖10)

棧上內存被清理,堆中依然存在,如圖11:

 
(圖11)

當程序須要更多的堆空間時,GC須要進行垃圾清理工做,暫停全部線程,找出全部不可達到對象,即無被引用的對象,進行清理。並通知棧中的指針從新指向地址排序後的對象。如今咱們應該知道,瞭解棧和堆,對咱們開發出高性能程序的重要性。當咱們使用引用類型的時候,通常是對指針進行的操做而非引用類型對象自己。可是值類型則操做其自己。
接下來,咱們用例子說明這一點。

例1:

public int ReturnValue()
           {
                int x = new int();
                 x = 3;
                int y = new int();
                 y = x;      
                 y = 4;         
                return x;
           }

執行結果爲3,稍做修改:

例2:

public class MyInt
           {
                public int MyValue;
           }

          public int ReturnValue2()
           {
                 MyInt x = new MyInt();
                 x.MyValue = 3;
                 MyInt y = new MyInt();
                 y = x;                 
                 y.MyValue = 4;              
                return x.MyValue;
           }

執行結果爲4。

咱們來分析下緣由,其實例1的跟如下代碼所起效用同樣:

public int ReturnValue()
           {
                int x = 3;
                int y = x;    
                 y = 4;
                return x;
           }

         
如圖12所示,在棧上x和y分別佔用一塊內存區,互不干擾。

(圖12)

而例2,與如下代碼所起效用同樣:

   public int ReturnValue2()
           {
                 MyInt x;
                 x.MyValue = 3;
                 MyInt y;
                 y = x;                
                 y.MyValue = 4;
                return x.MyValue;
           }

 

如圖13所示,

 (圖13)棧上的指針x和y指向堆上同一個區域,修改其一必會改變堆上的數據。

相關文章
相關標籤/搜索