在計算機領域,堆棧是一個不容忽視的概念,咱們編寫的C語言程序基本上都要用到。但對於不少的初學着來講,堆棧是一個很模糊的概念。堆棧:一種數據結構、一個在程序運行時用於存放的地方,這多是不少初學者的認識,由於我曾經就是這麼想的和彙編語言中的堆棧一詞混爲一談。我身邊的一些編程的朋友以及在網上看帖遇到的朋友中有好多也說不清堆棧,因此我想有必要給你們分享一下我對堆棧的見解,有說的不對的地方請朋友們不吝賜教,這對於你們學習會有很大幫助。
首先在數據結構上要知道堆棧,儘管咱們這麼稱呼它,但實際上堆棧是兩種數據結構:堆和棧。堆和棧都是一種數據項按序排列的數據結構。 php
咱們先從你們比較熟悉的棧提及吧,它是一種具備後進先出性質的數據結構,也就是說後存放的先取,先存放的後取。這就如同咱們要取出放在箱子裏面底下的東西(放入的比較早的物體),咱們首先要移開壓在它上面的物體(放入的比較晚的物體)。 html
而堆就不一樣了,堆是一種通過排序的樹形數據結構,每一個結點都有一個值。一般咱們所說的堆的數據結構,是指二叉堆。堆的特色是根結點的值最小(或最大),且根結點的兩個子樹也是一個堆。因爲堆的這個特性,經常使用來實現優先隊列,堆的存取是隨意,這就如同咱們在圖書館的書架上取書,雖然書的擺放是有順序的,可是咱們想取任意一本時沒必要像棧同樣,先取出前面全部的書,書架這種機制不一樣於箱子,咱們能夠直接取出咱們想要的書。 python
一個由C/C++編譯的程序佔用的內存分爲如下幾個部分: ios
1. 棧區(stack) ---由編譯器自動分配釋放,存放函數的參數值,局部變量的值等。其操做方式相似於數據結構中的棧。 程序員
2.堆區(heap) ---通常由程序員分配釋放,若程序員不釋放,程序結束時可能由OS回收。注意它與數據結構中的堆是兩回事,分配方式相似於鏈表。 shell
3.全局區(靜態區) ---全局變量和靜態變量的存儲時放在一塊的,初始化的全局變量和靜態變量在一塊區域,未初始化的全局變量和未初始化的靜態變量在相鄰的另外一塊區域。程序結束後有系統釋放。 編程
4.文字常量區 --- 常量字符串就是放在這裏的。程序結束後由系統釋放。 windows
5.程序代碼區 --- 存放函數體的二進制。 數組
然而我要說的重點並不在這,我要說的堆和棧並非數據結構的堆和棧,之因此要說數據結構的堆和棧是爲了和後面我要說的堆區和棧區區別開來,請你們必定要注意。 數據結構
下面就說說C語言程序內存分配中的堆和棧,這裏有必要把內存分配也提一下,你們不要嫌我囉嗦,通常狀況下程序存放在Rom或Flash中,運行時須要拷到內存中執行,內存會分別存儲不一樣的信息,以下圖所示:
堆:通常由程序員分配釋放,若程序員不釋放,程序結束時可能由OS回收。注意它數據結構中的堆是兩回事,分配方式是相似於鏈表。可能用到的關鍵字以下:new、malloc、delete、free等等。
棧:由編譯器Compiler自動分配釋放,存放函數的參數值、局部變量的值等。其操做方式相似於數據結構中的棧。
內存中的棧區處於相對較高的地址以地址的增加方向爲上的話,棧地址是向下增加的。棧中分配局部變量空間,堆區是向上增加的用於分配程序員申請的內存空間。另外還有靜態區是分配靜態變量,全局變量空間的;只讀區是分配常量和程序代碼空間的;以及其餘一些分區。
來看一個網上很流行的經典例子:
main.cpp
int a = 0; 全局初始化區
char *p1; 全局未初始化區
main()
{
int b; 棧
char s[] = "abc"; 棧
char *p2; 棧
char *p3 = "123456"; 123456\0在常量區,p3在棧上。
static int c =0; 全局(靜態)初始化區
p1 = (char *)malloc(10); 堆
p2 = (char *)malloc(20); 堆
}
堆:須要程序員本身申請,並指明大小。在C中malloc函數如p1 = (char*)malloc(10);在C++中用new運算符,可是注意p一、p2自己是在棧中的。由於他們仍是能夠認爲是局部變量。
棧:由系統自動分配,例如,聲明在函數中一個局部變量int b;系統自動在棧中爲b開闢空間。
不知道你是否有點明白了,堆和棧的第一個區別就是申請方式不一樣:棧(英文名稱是stack)是系統自動分配空間的,例如咱們定義一個 char a;系統會自動在棧上爲其開闢空間。而堆(英文名稱是heap)則是程序員根據須要本身申請的空間,例如malloc(10);開闢十個字節的空間。因爲棧上的空間是自動分配自動回收的,因此棧上的數據的生存週期只是在函數的運行過程中,運行後就釋放掉,不能夠再訪問。而堆上的數據只要程序員不釋放空間,就一直能夠訪問到,不過缺點是一旦忘記釋放會形成內存泄露。還有其餘的一些區別我認爲網上的朋友總結的不錯這裏轉述一下:
棧:只要棧的剩餘空間大於所申請空間,系統將爲程序提供內存,不然將報異常提示棧溢出。
堆:首先應該知道操做系統有一個記錄空閒內存地址的鏈表,當系統收到程序的申請時,會遍歷該鏈表,尋找第一個空間大於所申請空間的堆結點,而後將該結點從空閒結點鏈表中刪除,並將該結點的空間分配給程序,另外,對於大多數系統,會在這塊內存空間中的首地址處記錄本次分配的大小,這樣,代碼中的 delete語句才能正確的釋放本內存空間。另外,因爲找到的堆結點的大小不必定正好等於申請的大小,系統會自動的將多餘的那部分從新放入空閒鏈表中。
也就是說堆會在申請後還要作一些後續的工做這就會引出申請效率的問題。
根據第0點和第1點可知。
棧:由系統自動分配,速度較快。但程序員是沒法控制的。
堆:是由new分配的內存,通常速度比較慢,並且容易產生內存碎片,不過用起來最方便。
棧:在Windows下,棧是向低地址擴展的數據結構,是一塊連續的內存的區域。這句話的意思是棧頂的地址和棧的最大容量是系統預先規定好的,在 WINDOWS下,棧的大小是2M(也有的說是1M,總之是一個編譯時就肯定的常數),若是申請的空間超過棧的剩餘空間時,將提示overflow。所以,能從棧得到的空間較小。
堆:堆是向高地址擴展的數據結構,是不連續的內存區域。這是因爲系統是用鏈表來存儲的空閒內存地址的,天然是不連續的,而鏈表的遍歷方向是由低地址向高地址。堆的大小受限於計算機系統中有效的虛擬內存。因而可知,堆得到的空間比較靈活,也比較大。
因爲棧的大小有限,因此用子函數仍是有物理意義的,而不只僅是邏輯意義。
棧: 在函數調用時,第一個進棧的是主函數中函數調用後的下一條指令(函數調用語句的下一條可執行語句)的地址,而後是函數的各個參數,在大多數的C編譯器中,參數是由右往左入棧的,而後是函數中的局部變量。注意靜態變量是不入棧的。
當本次函數調用結束後,局部變量先出棧,而後是參數,最後棧頂指針指向最開始存的地址,也就是主函數中的下一條指令,程序由該點繼續運行。
堆:通常是在堆的頭部用一個字節存放堆的大小。堆中的具體內容有程序員安排。
關於存儲內容還能夠參考這道題。這道題還涉及到局部變量的存活期。
堆:char *s1 = "Hello World"; 是在編譯時就肯定的;
棧: char s1[] = "Hello World";是在運行時賦值的;用數組比用指針速度要快一些,由於指針在底層彙編中須要用edx寄存器中轉一下,而數組在棧上直接讀取。
char s1[] = "aaaaaaaaaaaaaaa";
char *s2 = "bbbbbbbbbbbbbbbbb";
aaaaaaaaaaa是在運行時刻賦值的;放在棧中。
而bbbbbbbbbbb是在編譯時就肯定的;放在堆中。
可是,在之後的存取中,在棧上的數組比指針所指向的字符串(例如堆)快。
好比:
#include
void main()
{
char a = 1;
char c[] = "1234567890";
char *p ="1234567890";
a = c[1];
a = p[1];
return;
}
對應的彙編代碼
10: a = c[1];
00401067 8A 4D F1 mov cl,byte ptr [ebp-0Fh]
0040106A 88 4D FC mov byte ptr [ebp-4],cl
11: a = p[1];
0040106D 8B 55 EC mov edx,dword ptr [ebp-14h]
00401070 8A 42 01 mov al,byte ptr [edx+1]
00401073 88 45 FC mov byte ptr [ebp-4],al
第一種在讀取時直接就把字符串的元素讀到寄存器cl中,而第二種則要先把指針讀到edx中,在根據edx讀取字符,顯然慢了。
堆和棧的區別能夠引用一位前輩的比喻來看出:
使用棧就象咱們去飯館裏吃飯,只管點菜(發出申請)、付錢、和吃(使用),吃飽了就走,沒必要理會切菜、洗菜等準備工做和洗碗、刷鍋等掃尾工做,他的好處是快捷,可是自由度小。
使用堆就象是本身動手作喜歡吃的菜餚,比較麻煩,可是比較符合本身的口味,並且自由度大。比喻很形象,說的很通俗易懂,不知道你是否有點收穫。
接觸過編程的人都知道,高級語言都能經過變量名來訪問內存中的數據。那麼這些變量在內存中是如何存放的呢?程序又是如何使用這些變量的呢?下面就會對此進行深刻的討論。下文中的C語言代碼如沒有特別聲明,默認都使用VC編譯的release版。
首先,來了解一下 C 語言的變量是如何在內存分部的。C 語言有全局變量(Global)、本地變量(Local),靜態變量(Static)、寄存器變量(Regeister)。每種變量都有不一樣的分配方式。先來看下面這段代碼:
#include <stdio.h> int g1=0, g2=0, g3=0; int main() { static int s1=0, s2=0, s3=0; int v1=0, v2=0, v3=0; //打印出各個變量的內存地址 printf("0x%08x/n",&v1); //打印各本地變量的內存地址 printf("0x%08x/n",&v2); printf("0x%08x/n/n",&v3); printf("0x%08x/n",&g1); //打印各全局變量的內存地址 printf("0x%08x/n",&g2); printf("0x%08x/n/n",&g3); printf("0x%08x/n",&s1); //打印各靜態變量的內存地址 printf("0x%08x/n",&s2); printf("0x%08x/n/n",&s3); return 0; }
編譯後的執行結果是:
0x0012ff78 0x0012ff7c 0x0012ff80 0x004068d0 0x004068d4 0x004068d8 0x004068dc 0x004068e0 0x004068e4
輸出的結果就是變量的內存地址。其中v1,v2,v3是本地變量,g1,g2,g3是全局變量,s1,s2,s3是靜態變量。你能夠看到這些變量在內存是連續分佈的,可是本地變量和全局變量分配的內存地址差了十萬八千里,而全局變量和靜態變量分配的內存是連續的。這是由於本地變量和全局/靜態變量是分配在不一樣類型的內存區域中的結果。對於一個進程的內存空間而言,能夠在邏輯上分紅3個部份:代碼區,靜態數據區和動態數據區。動態數據區通常就是「堆棧」。「棧(stack)」和「堆(heap)」是兩種不一樣的動態數據區,棧是一種線性結構,堆是一種鏈式結構。進程的每一個線程都有私有的「棧」,因此每一個線程雖然代碼同樣,但本地變量的數據都是互不干擾。一個堆棧能夠經過「基地址」和「棧頂」地址來描述。全局變量和靜態變量分配在靜態數據區,本地變量分配在動態數據區,即堆棧中。程序經過堆棧的基地址和偏移量來訪問本地變量。
├———————┤低端內存區域
│ …… │
├———————┤
│ 動態數據區 │
├———————┤
│ …… │
├———————┤
│ 代碼區 │
├———————┤
│ 靜態數據區 │
├———————┤
│ …… │
├———————┤高端內存區域
堆棧是一個先進後出的數據結構,棧頂地址老是小於等於棧的基地址。咱們能夠先了解一下函數調用的過程,以便對堆棧在程序中的做用有更深刻的瞭解。不一樣的語言有不一樣的函數調用規定,這些因素有參數的壓入規則和堆棧的平衡。windows API的調用規則和ANSI C的函數調用規則是不同的,前者由被調函數調整堆棧,後者由調用者調整堆棧。二者經過「__stdcall」和「__cdecl」前綴區分。先看下面這段代碼:
#include <stdio.h> void __stdcall func(int param1,int param2,int param3) { int var1=param1; int var2=param2; int var3=param3; printf("0x%08x/n",¶m1); //打印出各個變量的內存地址 printf("0x%08x/n",¶m2); printf("0x%08x/n/n",¶m3); printf("0x%08x/n",&var1); printf("0x%08x/n",&var2); printf("0x%08x/n/n",&var3); return; } int main() { func(1,2,3); return 0; }編譯後的執行結果:
0x0012ff78 0x0012ff7c 0x0012ff80 0x0012ff68 0x0012ff6c 0x0012ff70
├———————┤<—函數執行時的棧頂(ESP)、低端內存區域
│ …… │
├———————┤
│ var 1 │
├———————┤
│ var 2 │
├———————┤
│ var 3 │
├———————┤
│ RET │
├———————┤<—「__cdecl」函數返回後的棧頂(ESP)
│ parameter 1 │
├———————┤
│ parameter 2 │
├———————┤
│ parameter 3 │
├———————┤<—「__stdcall」函數返回後的棧頂(ESP)
│ …… │
├———————┤<—棧底(基地址 EBP)、高端內存區域
上圖就是函數調用過程當中堆棧的樣子了。首先,三個參數以從右到左的次序壓入堆棧,先壓「param3」,再壓「param2」,最後壓入「param1」;而後壓入函數的返回地址(RET),接着跳轉到函數地址接着執行(這裏要補充一點,介紹UNIX下的緩衝溢出原理的文章中都提到在壓入RET後,繼續壓入當前EBP,而後用當前ESP代替EBP。然而,有一篇介紹windows下函數調用的文章中說,在windows下的函數調用也有這一步驟,但根據個人實際調試,並未發現這一步,這還能夠從param3和var1之間只有4字節的間隙這點看出來);第三步,將棧頂(ESP)減去一個數,爲本地變量分配內存空間,上例中是減去12字節(ESP=ESP-3*4,每一個int變量佔用4個字節);接着就初始化本地變量的內存空間。因爲「__stdcall」調用由被調函數調整堆棧,因此在函數返回前要恢復堆棧,先回收本地變量佔用的內存(ESP=ESP+3*4),而後取出返回地址,填入EIP寄存器,回收先前壓入參數佔用的內存(ESP=ESP+3*4),繼續執行調用者的代碼。參見下列彙編代碼:
;--------------func 函數的彙編代碼------------------- :00401000 83EC0C sub esp, 0000000C //建立本地變量的內存空間 :00401003 8B442410 mov eax, dword ptr [esp+10] :00401007 8B4C2414 mov ecx, dword ptr [esp+14] :0040100B 8B542418 mov edx, dword ptr [esp+18] :0040100F 89442400 mov dword ptr [esp], eax :00401013 8D442410 lea eax, dword ptr [esp+10] :00401017 894C2404 mov dword ptr [esp+04], ecx ……………………(省略若干代碼) :00401075 83C43C add esp, 0000003C ;恢復堆棧,回收本地變量的內存空間 :00401078 C3 ret 000C ;函數返回,恢復參數佔用的內存空間 ;若是是「__cdecl」的話,這裏是「ret」,堆棧將由調用者恢復 ;-------------------函數結束------------------------- ;--------------主程序調用func函數的代碼-------------- :00401080 6A03 push 00000003 //壓入參數param3 :00401082 6A02 push 00000002 //壓入參數param2 :00401084 6A01 push 00000001 //壓入參數param1 :00401086 E875FFFFFF call 00401000 //調用func函數 ;若是是「__cdecl」的話,將在這裏恢復堆棧,「add esp, 0000000C」 聰明的讀者看到這裏,差很少就明白緩衝溢出的原理了。先來看下面的代碼: #include <stdio.h> #include <string.h> void __stdcall func() { char lpBuff[8]="/0"; strcat(lpBuff,"AAAAAAAAAAA"); return; } int main() { func(); return 0; }
編譯後執行一下回怎麼樣?哈,「"0x00414141"指令引用的"0x00000000"內存。該內存不能爲"read"。」,「非法操做」嘍!"41"就是"A"的16進制的ASCII碼了,那明顯就是strcat這句出的問題了。"lpBuff"的大小隻有8字節,算進結尾的/0,那strcat最多隻能寫入7個"A",但程序實際寫入了11個"A"外加1個/0。再來看看上面那幅圖,多出來的4個字節正好覆蓋了RET的所在的內存空間,致使函數返回到一個錯誤的內存地址,執行了錯誤的指令。若是能精心構造這個字符串,使它分紅三部分,前一部份僅僅是填充的無心義數據以達到溢出的目的,接着是一個覆蓋RET的數據,緊接着是一段shellcode,那隻要着個RET地址能指向這段shellcode的第一個指令,那函數返回時就能執行shellcode了。可是軟件的不一樣版本和不一樣的運行環境均可能影響這段shellcode在內存中的位置,那麼要構造這個RET是十分困難的。通常都在RET和shellcode之間填充大量的NOP指令,使得exploit有更強的通用性。
├———————┤<—低端內存區域
│ …… │
├———————┤<—由exploit填入數據的開始
│ │
│ buffer │<—填入無用的數據
│ │
├———————┤
│ RET │<—指向shellcode,或NOP指令的範圍
├———————┤
│ NOP │
│ …… │<—填入的NOP指令,是RET可指向的範圍
│ NOP │
├———————┤
│ │
│ shellcode │
│ │
├———————┤<—由exploit填入數據的結束
│ …… │
├———————┤<—高端內存區域
windows下的動態數據除了可存放在棧中,還能夠存放在堆中。瞭解C++的朋友都知道,C++可使用new關鍵字來動態分配內存。來看下面的C++代碼:
#include <stdio.h> #include <iostream.h> #include <windows.h> void func() { char *buffer=new char[128]; char bufflocal[128]; static char buffstatic[128]; printf("0x%08x/n",buffer); //打印堆中變量的內存地址 printf("0x%08x/n",bufflocal); //打印本地變量的內存地址 printf("0x%08x/n",buffstatic); //打印靜態變量的內存地址 } void main() { func(); return; } 程序執行結果爲: 0x004107d0 0x0012ff04 0x004068c0
能夠發現用new關鍵字分配的內存即不在棧中,也不在靜態數據區。VC編譯器是經過windows下的「堆(heap)」來實現new關鍵字的內存動態分配。在講「堆」以前,先來了解一下和「堆」有關的幾個API函數:
HeapAlloc 在堆中申請內存空間
HeapCreate 建立一個新的堆對象
HeapDestroy 銷燬一個堆對象
HeapFree 釋放申請的內存
HeapWalk 枚舉堆對象的全部內存塊
GetProcessHeap 取得進程的默認堆對象
GetProcessHeaps 取得進程全部的堆對象
LocalAlloc
GlobalAlloc
當進程初始化時,系統會自動爲進程建立一個默認堆,這個堆默認所佔內存的大小爲1M。堆對象由系統進行管理,它在內存中以鏈式結構存在。經過下面的代碼能夠經過堆動態申請內存空間:
HANDLE hHeap=GetProcessHeap();
char *buff=HeapAlloc(hHeap,0,8);
其中hHeap是堆對象的句柄,buff是指向申請的內存空間的地址。那這個hHeap到底是什麼呢?它的值有什麼意義嗎?看看下面這段代碼吧:
#pragma comment(linker,"/entry:main") //定義程序的入口
#include <windows.h>
_CRTIMP int (__cdecl *printf)(const char *, ...); //定義STL函數printf
/*---------------------------------------------------------------------------
寫到這裏,咱們順便來複習一下前面所講的知識:
(*注)printf函數是C語言的標準函數庫中函數,VC的標準函數庫由msvcrt.dll模塊實現。
由函數定義可見,printf的參數個數是可變的,函數內部沒法預先知道調用者壓入的參數個數,函數只能經過分析第一個參數字符串的格式來得到壓入參數的信息,因爲這裏參數的個數是動態的,因此必須由調用者來平衡堆棧,這裏便使用了__cdecl調用規則。BTW,Windows系統的API函數基本上是__stdcall調用形式,只有一個API例外,那就是wsprintf,它使用__cdecl調用規則,同printf函數同樣,這是因爲它的參數個數是可變的緣故。
---------------------------------------------------------------------------*/ void main() { HANDLE hHeap=GetProcessHeap(); char *buff=HeapAlloc(hHeap,0,0x10); char *buff2=HeapAlloc(hHeap,0,0x10); HMODULE hMsvcrt=LoadLibrary("msvcrt.dll"); printf=(void *)GetProcAddress(hMsvcrt,"printf"); printf("0x%08x/n",hHeap); printf("0x%08x/n",buff); printf("0x%08x/n/n",buff2); } 執行結果爲: 0x00130000 0x00133100 0x00133118
hHeap的值怎麼和那個buff的值那麼接近呢?其實hHeap這個句柄就是指向HEAP首部的地址。在進程的用戶區存着一個叫PEB(進程環境塊)的結構,這個結構中存放着一些有關進程的重要信息,其中在PEB首地址偏移0x18處存放的ProcessHeap就是進程默認堆的地址,而偏移0x90處存放了指向進程全部堆的地址列表的指針。windows有不少API都使用進程的默認堆來存放動態數據,如windows 2000下的全部ANSI版本的函數都是在默認堆中申請內存來轉換ANSI字符串到Unicode字符串的。對一個堆的訪問是順序進行的,同一時刻只能有一個線程訪問堆中的數據,當多個線程同時有訪問要求時,只能排隊等待,這樣便形成程序執行效率降低。
最後來講說內存中的數據對齊。所謂數據對齊,是指數據所在的內存地址必須是該數據長度的整數倍,DWORD數據的內存起始地址能被4除盡,WORD數據的內存起始地址能被2除盡,x86 CPU能直接訪問對齊的數據,當他試圖訪問一個未對齊的數據時,會在內部進行一系列的調整,這些調整對於程序來講是透明的,可是會下降運行速度,因此編譯器在編譯程序時會盡可能保證數據對齊。一樣一段代碼,咱們來看看用VC、Dev-C++和lcc三個不一樣編譯器編譯出來的程序的執行結果:
#include <stdio.h> int main() { int a; char b; int c; printf("0x%08x/n",&a); printf("0x%08x/n",&b); printf("0x%08x/n",&c); return 0; } 這是用VC編譯後的執行結果: 0x0012ff7c 0x0012ff7b 0x0012ff80 變量在內存中的順序:b(1字節)-a(4字節)-c(4字節)。 這是用Dev-C++編譯後的執行結果: 0x0022ff7c 0x0022ff7b 0x0022ff74 變量在內存中的順序:c(4字節)-中間相隔3字節-b(佔1字節)-a(4字節)。 這是用lcc編譯後的執行結果: 0x0012ff6c 0x0012ff6b 0x0012ff64 變量在內存中的順序:同上。 三個編譯器都作到了數據對齊,可是後兩個編譯器顯然沒VC「聰明」,讓一個char佔了4字節,浪費內存哦。
基礎知識:
堆棧是一種簡單的數據結構,是一種只容許在其一端進行插入或刪除的線性表。容許插入或刪除操做的一端稱爲棧頂,另外一端稱爲棧底,對堆棧的插入和刪除操做被稱爲入棧和出棧。有一組CPU指令能夠實現對進程的內存實現堆棧訪問。其中,POP指令實現出棧操做,PUSH指令實現入棧操做。CPU的ESP寄存器存放當前線程的棧頂指針,EBP寄存器中保存當前線程的棧底指針。CPU的EIP寄存器存放下一個CPU指令存放的內存地址,當CPU執行完當前的指令後,從EIP寄存器中讀取下一條指令的內存地址,而後繼續執行。
【http://www.cnblogs.com/wanqieddy/archive/2012/05/07/2486974.html】