C++內存詳解[精]

時間 2019-11-08

標籤 c++ 內存詳解欄目 C&C++ 简体版

原文原文鏈接

偉大的Bill Gates 曾經失言：程序員

　　640K ought to be enough for everybody — Bill Gates 1981 編程

　　程序員們常常編寫內存管理程序，每每提心吊膽。若是不想觸雷，惟一的解決辦法就是發現全部潛伏的地雷而且排除它們，躲是躲不了的。本文的內容比通常教科書的要深刻得多，讀者需細心閱讀，作到真正地通曉內存管理。數組

　　一、內存分配方式安全

　　內存分配方式有三種：數據結構

　　（1）從靜態存儲區域分配。內存在程序編譯的時候就已經分配好，這塊內存在程序的整個運行期間都存在。例如全局變量，static變量。函數

　　（2）在棧上建立。在執行函數時，函數內局部變量的存儲單元均可以在棧上建立，函數執行結束時這些存儲單元自動被釋放。棧內存分配運算內置於處理器的指令集中，效率很高，可是分配的內存容量有限。學習

　　（3）從堆上分配，亦稱動態內存分配。程序在運行的時候用malloc或new申請任意多少的內存，程序員本身負責在什麼時候用free或delete釋放內存。動態內存的生存期由咱們決定，使用很是靈活，但問題也最多。測試

　　二、常見的內存錯誤及其對策spa

　　發生內存錯誤是件很是麻煩的事情。編譯器不能自動發現這些錯誤，一般是在程序運行時才能捕捉到。而這些錯誤大多沒有明顯的症狀，時隱時現，增長了改錯的難度。有時用戶怒氣衝衝地把你找來，程序卻沒有發生任何問題，你一走，錯誤又發做了。常見的內存錯誤及其對策以下：操作系統

　　* 內存分配未成功，卻使用了它。

　　編程新手常犯這種錯誤，由於他們沒有意識到內存分配會不成功。經常使用解決辦法是，在使用內存以前檢查指針是否爲NULL。若是指針p是函數的參數，那麼在函數的入口處用assert(p!=NULL)進行

　　檢查。若是是用malloc或new來申請內存，應該用if(p==NULL) 或if(p!=NULL)進行防錯處理。

　　* 內存分配雖然成功，可是還沒有初始化就引用它。

　　犯這種錯誤主要有兩個原由：一是沒有初始化的觀念；二是誤覺得內存的缺省初值全爲零，致使引用初值錯誤（例如數組）。內存的缺省初值到底是什麼並無統一的標準，儘管有些時候爲零值，咱們寧肯信其無不可信其有。因此不管用何種方式建立數組，都別忘了賦初值，即使是賦零值也不可省略，不要嫌麻煩。

　　* 內存分配成功而且已經初始化，但操做越過了內存的邊界。

　　例如在使用數組時常常發生下標「多1」或者「少1」的操做。特別是在for循環語句中，循環次數很容易搞錯，致使數組操做越界。

　　* 忘記了釋放內存，形成內存泄露。

　　含有這種錯誤的函數每被調用一次就丟失一塊內存。剛開始時系統的內存充足，你看不到錯誤。終有一次程序忽然死掉，系統出現提示：內存耗盡。動態內存的申請與釋放必須配對，程序中malloc與free的使用次數必定要相同，不然確定有錯誤（new/delete同理）。

　　* 釋放了內存卻繼續使用它。
　
　　有三種狀況：

　　（1）程序中的對象調用關係過於複雜，實在難以搞清楚某個對象到底是否已經釋放了內存，此時應該從新設計數據結構，從根本上解決對象管理的混亂局面。

　　（2）函數的return語句寫錯了，注意不要返回指向「棧內存」的「指針」或者「引用」，由於該內存在函數體結束時被自動銷燬。

　　（3）使用free或delete釋放了內存後，沒有將指針設置爲NULL。致使產生「野指針」。

　　【規則1】用malloc或new申請內存以後，應該當即檢查指針值是否爲NULL。防止使用指針值爲NULL的內存。

　　【規則2】不要忘記爲數組和動態內存賦初值。防止將未被初始化的內存做爲右值使用。

　　【規則3】避免數組或指針的下標越界，特別要小心發生「多1」或者「少1」操做。

　　【規則4】動態內存的申請與釋放必須配對，防止內存泄漏。

　　【規則5】用free或delete釋放了內存以後，當即將指針設置爲NULL，防止產生「野指針」。

　　三、指針與數組的對比

　　C++/C程序中，指針和數組在很多地方能夠相互替換着用，讓人產生一種錯覺，覺得二者是等價的。

　　數組要麼在靜態存儲區被建立（如全局數組），要麼在棧上被建立。數組名對應着（而不是指向）一塊內存，其地址與容量在生命期內保持不變，只有數組的內容能夠改變。

　　指針能夠隨時指向任意類型的內存塊，它的特徵是「可變」，因此咱們經常使用指針來操做動態內存。指針遠比數組靈活，但也更危險。

　　下面以字符串爲例比較指針與數組的特性。

　　3.1 修改內容

　　示例3-1中，字符數組a的容量是6個字符，其內容爲hello。a的內容能夠改變，如a[0]= ‘X’。指針p指向常量字符串「world」（位於靜態存儲區，內容爲world），常量字符串的內容是不能夠被修改的。從語法上看，編譯器並不以爲語句p[0]= ‘X’有什麼不妥，可是該語句企圖修改常量字符串的內容而致使運行錯誤。

char a[] = 「hello」;
a[0] = ‘X’;
cout << a << endl;
char *p = 「world」; // 注意p指向常量字符串
p[0] = ‘X’; // 編譯器不能發現該錯誤
cout << p << endl;
　　　　　　示例3.1 修改數組和指針的內容

　　3.2 內容複製與比較

　　不能對數組名進行直接複製與比較。示例7-3-2中，若想把數組a的內容複製給數組b，不能用語句 b = a ，不然將產生編譯錯誤。應該用標準庫函數strcpy進行復制。同理，比較b和a的內容是否相同，不能用if(b==a) 來判斷，應該用標準庫函數strcmp進行比較。

　　語句p = a 並不能把a的內容複製指針p，而是把a的地址賦給了p。要想複製a的內容，能夠先用庫函數malloc爲p申請一塊容量爲strlen(a)+1個字符的內存，再用strcpy進行字符串複製。同理，語句if(p==a) 比較的不是內容而是地址，應該用庫函數strcmp來比較。

// 數組…
char a[] = "hello";
char b[10];
strcpy(b, a); // 不能用 b = a;
if(strcmp(b, a) == 0) // 不能用 if (b == a)
…
// 指針…
int len = strlen(a);
char *p = (char *)malloc(sizeof(char)*(len+1));
strcpy(p,a); // 不要用 p = a;
if(strcmp(p, a) == 0) // 不要用 if (p == a)
…
　　　　　　　示例3.2 數組和指針的內容複製與比較

　　3.3 計算內存容量

　　用運算符sizeof能夠計算出數組的容量（字節數）。示例7-3-3（a）中，sizeof(a)的值是12（注意別忘了’’）。指針p指向a，可是sizeof(p)的值倒是4。這是由於sizeof(p)獲得的是一個指針變量的字節數，至關於sizeof(char*)，而不是p所指的內存容量。C++/C語言沒有辦法知道指針所指的內存容量，除非在申請內存時記住它。

　　注意當數組做爲函數的參數進行傳遞時，該數組自動退化爲同類型的指針。示例7-3-3（b）中，不論數組a的容量是多少，sizeof(a)始終等於sizeof(char *)。

char a[] = "hello world";
char *p = a;
cout<< sizeof(a) << endl; // 12字節
cout<< sizeof(p) << endl; // 4字節
　　　　　示例3.3（a）計算數組和指針的內存容量

void Func(char a[100])
{
　cout<< sizeof(a) << endl; // 4字節而不是100字節
}

　　　　　示例3.3（b）數組退化爲指針

　　四、指針參數是如何傳遞內存的？

　　若是函數的參數是一個指針，不要期望用該指針去申請動態內存。示例7-4-1中，Test函數的語句GetMemory(str, 200)並無使str得到指望的內存，str依舊是NULL，爲何？

void GetMemory(char *p, int num)
{
　p = (char *)malloc(sizeof(char) * num);
}
void Test(void)
{
　char *str = NULL;
　GetMemory(str, 100); // str 仍然爲 NULL
　strcpy(str, "hello"); // 運行錯誤
}
　　　　　　示例4.1 試圖用指針參數申請動態內存

　　毛病出在函數GetMemory中。編譯器老是要爲函數的每一個參數製做臨時副本，指針參數p的副本是 _p，編譯器使 _p = p。若是函數體內的程序修改了_p的內容，就致使參數p的內容做相應的修改。這就是指針能夠用做輸出參數的緣由。在本例中，_p申請了新的內存，只是把_p所指的內存地址改變了，可是p絲毫未變。因此函數GetMemory並不能輸出任何東西。事實上，每執行一次GetMemory就會泄露一塊內存，由於沒有用free釋放內存。

　　若是非得要用指針參數去申請內存，那麼應該改用「指向指針的指針」，見示例4.2。

void GetMemory2(char **p, int num)
{
　*p = (char *)malloc(sizeof(char) * num);
}
void Test2(void)
{
　char *str = NULL;
　GetMemory2(&str, 100); // 注意參數是 &str，而不是str
　strcpy(str, "hello");
　cout<< str << endl;
　free(str);
}
　　　　　　示例4.2用指向指針的指針申請動態內存

　　因爲「指向指針的指針」這個概念不容易理解，咱們能夠用函數返回值來傳遞動態內存。這種方法更加簡單，見示例4.3。

char *GetMemory3(int num)
{
　char *p = (char *)malloc(sizeof(char) * num);
　return p;
}
void Test3(void)
{
　char *str = NULL;
　str = GetMemory3(100);
　strcpy(str, "hello");
　cout<< str << endl;
　free(str);
}
　　　　　　　示例4.3 用函數返回值來傳遞動態內存

　　用函數返回值來傳遞動態內存這種方法雖然好用，可是經常有人把return語句用錯了。這裏強調不要用return語句返回指向「棧內存」的指針，由於該內存在函數結束時自動消亡，見示例4.4。

char *GetString(void)
{
　char p[] = "hello world";
　return p; // 編譯器將提出警告
}
void Test4(void)
{
　char *str = NULL;
　str = GetString(); // str 的內容是垃圾
　cout<< str << endl;
}
　　　　　　示例4.4 return語句返回指向「棧內存」的指針

　　用調試器逐步跟蹤Test4，發現執行str = GetString語句後str再也不是NULL指針，可是str的內容不是「hello world」而是垃圾。
若是把示例4.4改寫成示例4.5，會怎麼樣？

char *GetString2(void)
{
　char *p = "hello world";
　return p;
}
void Test5(void)
{
　char *str = NULL;
　str = GetString2();
　cout<< str << endl;
}
　　　　　示例4.5 return語句返回常量字符串

　　函數Test5運行雖然不會出錯，可是函數GetString2的設計概念倒是錯誤的。由於GetString2內的「hello world」是常量字符串，位於靜態存儲區，它在程序生命期內恆定不變。不管何時調用GetString2，它返回的始終是同一個「只讀」的內存塊。

　　五、杜絕「野指針」

　　「野指針」不是NULL指針，是指向「垃圾」內存的指針。人們通常不會錯用NULL指針，由於用if語句很容易判斷。可是「野指針」是很危險的，if語句對它不起做用。「野指針」的成因主要有兩種：

　　（1）指針變量沒有被初始化。任何指針變量剛被建立時不會自動成爲NULL指針，它的缺省值是隨機的，它會亂指一氣。因此，指針變量在建立的同時應當被初始化，要麼將指針設置爲NULL，要麼讓它指向合法的內存。例如

char *p = NULL;
char *str = (char *) malloc(100);

　　（2）指針p被free或者delete以後，沒有置爲NULL，讓人誤覺得p是個合法的指針。

　　（3）指針操做超越了變量的做用範圍。這種狀況讓人防不勝防，示例程序以下：

class A
{
　public:
　　void Func(void){ cout << 「Func of class A」 << endl; }
};
void Test(void)
{
　A *p;
　{
　　A a;
　　p = &a; // 注意 a 的生命期
　}
　p->Func(); // p是「野指針」
}

　　函數Test在執行語句p->Func()時，對象a已經消失，而p是指向a的，因此p就成了「野指針」。但奇怪的是我運行這個程序時竟然沒有出錯，這可能與編譯器有關。

　　六、有了malloc/free爲何還要new/delete？

　　malloc與free是C++/C語言的標準庫函數，new/delete是C++的運算符。它們均可用於申請動態內存和釋放內存。

　　對於非內部數據類型的對象而言，光用maloc/free沒法知足動態對象的要求。對象在建立的同時要自動執行構造函數，對象在消亡以前要自動執行析構函數。因爲malloc/free是庫函數而不是運算符，不在編譯器控制權限以內，不可以把執行構造函數和析構函數的任務強加於malloc/free。

　　所以C++語言須要一個能完成動態內存分配和初始化工做的運算符new，以及一個能完成清理與釋放內存工做的運算符delete。注意new/delete不是庫函數。咱們先看一看malloc/free和new/delete如何實現對象的動態內存管理，見示例6。

class Obj
{
　public :
　　Obj(void){ cout << 「Initialization」 << endl; }
　　~Obj(void){ cout << 「Destroy」 << endl; }
　　void Initialize(void){ cout << 「Initialization」 << endl; }
　　void Destroy(void){ cout << 「Destroy」 << endl; }
};
void UseMallocFree(void)
{
　Obj *a = (obj *)malloc(sizeof(obj)); // 申請動態內存
　a->Initialize(); // 初始化
　//…
　a->Destroy(); // 清除工做
　free(a); // 釋放內存
}
void UseNewDelete(void)
{
　Obj *a = new Obj; // 申請動態內存而且初始化
　//…
　delete a; // 清除而且釋放內存
}
　　　　　示例6 用malloc/free和new/delete如何實現對象的動態內存管理

　　類Obj的函數Initialize模擬了構造函數的功能，函數Destroy模擬了析構函數的功能。函數UseMallocFree中，因爲malloc/free不能執行構造函數與析構函數，必須調用成員函數Initialize和Destroy來完成初始化與清除工做。函數UseNewDelete則簡單得多。

　　因此咱們不要企圖用malloc/free來完成動態對象的內存管理，應該用new/delete。因爲內部數據類型的「對象」沒有構造與析構的過程，對它們而言malloc/free和new/delete是等價的。

　　既然new/delete的功能徹底覆蓋了malloc/free，爲何C++不把malloc/free淘汰出局呢？這是由於C++程序常常要調用C函數，而C程序只能用malloc/free管理動態內存。

　　若是用free釋放「new建立的動態對象」，那麼該對象因沒法執行析構函數而可能致使程序出錯。若是用delete釋放「malloc申請的動態內存」，理論上講程序不會出錯，可是該程序的可讀性不好。因此new/delete必須配對使用，malloc/free也同樣。

　　七、內存耗盡怎麼辦？

　　若是在申請動態內存時找不到足夠大的內存塊，malloc和new將返回NULL指針，宣告內存申請失敗。一般有三種方式處理「內存耗盡」問題。

　　（1）判斷指針是否爲NULL，若是是則立刻用return語句終止本函數。例如：

void Func(void)
{
　A *a = new A;
　if(a == NULL)
　{
　　return;
　}
　…
}

　　（2）判斷指針是否爲NULL，若是是則立刻用exit(1)終止整個程序的運行。例如：

void Func(void)
{
　A *a = new A;
　if(a == NULL)
　{
　　cout << 「Memory Exhausted」 << endl;
　　exit(1);
　}
　…
}

　　（3）爲new和malloc設置異常處理函數。例如Visual C++能夠用_set_new_hander函數爲new設置用戶本身定義的異常處理函數，也可讓malloc享用與new相同的異常處理函數。詳細內容請參考C++使用手冊。

　　上述（1）（2）方式使用最廣泛。若是一個函數內有多處須要申請動態內存，那麼方式（1）就顯得力不從心（釋放內存很麻煩），應該用方式（2）來處理。

　　不少人不忍心用exit(1)，問：「不編寫出錯處理程序，讓操做系統本身解決行不行？」

　　不行。若是發生「內存耗盡」這樣的事情，通常說來應用程序已經無藥可救。若是不用exit(1) 把壞程序殺死，它可能會害死操做系統。道理如同：若是不把歹徒擊斃，歹徒在老死以前會犯下更多的罪。

　　有一個很重要的現象要告訴你們。對於32位以上的應用程序而言，不管怎樣使用malloc與new，幾乎不可能致使「內存耗盡」。我在Windows 98下用Visual C++編寫了測試程序，見示例7。這個程序會無休止地運行下去，根本不會終止。由於32位操做系統支持「虛存」，內存用完了，自動用硬盤空間頂替。我只聽到硬盤嘎吱嘎吱地響，Window 98已經累得對鍵盤、鼠標毫無反應。

　　我能夠得出這麼一個結論：對於32位以上的應用程序，「內存耗盡」錯誤處理程序毫無用處。這下可把Unix和Windows程序員們樂壞了：反正錯誤處理程序不起做用，我就不寫了，省了不少麻煩。

　　我不想誤導讀者，必須強調：不加錯誤處理將致使程序的質量不好，千萬不可因小失大。

void main(void)
{
　float *p = NULL;
　while(TRUE)
　{
　　p = new float[1000000];
　　cout << 「eat memory」 << endl;
　　if(p==NULL)
　　　exit(1);
　}
}

　　示例7試圖耗盡操做系統的內存

　　八、malloc/free 的使用要點

　　函數malloc的原型以下：

void * malloc(size_t size);

　　用malloc申請一塊長度爲length的整數類型的內存，程序以下：

int *p = (int *) malloc(sizeof(int) * length);

　　咱們應當把注意力集中在兩個要素上：「類型轉換」和「sizeof」。

　　* malloc返回值的類型是void *，因此在調用malloc時要顯式地進行類型轉換，將void * 轉換成所須要的指針類型。

　　* malloc函數自己並不識別要申請的內存是什麼類型，它只關心內存的總字節數。咱們一般記不住int, float等數據類型的變量的確切字節數。例如int變量在16位系統下是2個字節，在32位下是4個字節；而float變量在16位系統下是4個字節，在32位下也是4個字節。最好用如下程序做一次測試：

cout << sizeof(char) << endl;
cout << sizeof(int) << endl;
cout << sizeof(unsigned int) << endl;
cout << sizeof(long) << endl;
cout << sizeof(unsigned long) << endl;
cout << sizeof(float) << endl;
cout << sizeof(double) << endl;
cout << sizeof(void *) << endl;

　　在malloc的「()」中使用sizeof運算符是良好的風格，但要小心有時咱們會昏了頭，寫出 p = malloc(sizeof(p))這樣的程序來。

　　* 函數free的原型以下：

void free( void * memblock );

　　爲何free函數不象malloc函數那樣複雜呢？這是由於指針p的類型以及它所指的內存的容量事先都是知道的，語句free(p)能正確地釋放內存。若是p是NULL指針，那麼free對p不管操做多少次都不會出問題。若是p不是NULL指針，那麼free對p連續操做兩次就會致使程序運行錯誤。

　　九、new/delete 的使用要點

　　運算符new使用起來要比函數malloc簡單得多，例如：

int *p1 = (int *)malloc(sizeof(int) * length);
int *p2 = new int[length];

　　這是由於new內置了sizeof、類型轉換和類型安全檢查功能。對於非內部數據類型的對象而言，new在建立動態對象的同時完成了初始化工做。若是對象有多個構造函數，那麼new的語句也能夠有多種形式。例如

class Obj
{
　public :
　　Obj(void); // 無參數的構造函數
　　Obj(int x); // 帶一個參數的構造函數
　　…
}
void Test(void)
{
　Obj *a = new Obj;
　Obj *b = new Obj(1); // 初值爲1
　…
　delete a;
　delete b;
}

　　若是用new建立對象數組，那麼只能使用對象的無參數構造函數。例如

Obj *objects = new Obj[100]; // 建立100個動態對象

　　不能寫成

Obj *objects = new Obj[100](1);// 建立100個動態對象的同時賦初值1

　　在用delete釋放對象數組時，留意不要丟了符號‘[]’。例如

delete []objects; // 正確的用法
delete objects; // 錯誤的用法

　　後者至關於delete objects[0]，漏掉了另外99個對象。

　　十、一些心得體會

　　我認識很多技術不錯的C++/C程序員，不多有人能拍拍胸脯說通曉指針與內存管理（包括我本身）。我最初學習C語言時特別怕指針，致使我開發第一個應用軟件（約1萬行C代碼）時沒有使用一個指針，全用數組來頂替指針，實在蠢笨得過度。躲避指針不是辦法，後來我改寫了這個軟件，代碼量縮小到原先的一半。

　　個人經驗教訓是：

　　（1）越是怕指針，就越要使用指針。不會正確使用指針，確定算不上是合格的程序員。

　　（2）必須養成「使用調試器逐步跟蹤程序」的習慣，只有這樣才能發現問題的本質。