考慮下面的結構體定義:編程
假設這個結構體的成員在內存中是緊湊排列的,且c1的起始地址是0,則s的地址就是1,c2的地址是3,i的地址是4。數組
如今,咱們編寫一個簡單的程序:安全
運行後輸出:微信
爲何會這樣?這就是字節對齊致使的問題。數據結構
本文在參考諸多資料的基礎上,詳細介紹常見的字節對齊問題。因成文較早,資料來源大多已不可考,敬請諒解。架構
現代計算機中,內存空間按照字節劃分,理論上能夠從任何起始地址訪問任意類型的變量。但實際中在訪問特定類型變量時常常在特定的內存地址訪問,這就須要各類類型數據按照必定的規則在空間上排列,而不是順序一個接一個地存放,這就是對齊。函數
不一樣硬件平臺對存儲空間的處理上存在很大的不一樣。某些平臺對特定類型的數據只能從特定地址開始存取,而不容許其在內存中任意存放。例如Motorola 68000處理器不容許16位的字存放在奇地址,不然會觸發異常,所以在這種架構下編程必須保證字節對齊。工具
但最多見的狀況是,若是不按照平臺要求對數據存放進行對齊,會帶來存取效率上的損失。好比32位的Intel處理器經過總線訪問(包括讀和寫)內存數據。每一個總線週期從偶地址開始訪問32位內存數據,內存數據以字節爲單位存放。若是一個32位的數據沒有存放在4字節整除的內存地址處,那麼處理器就須要2個總線週期對其進行訪問,顯然訪問效率降低不少。性能
所以,經過合理的內存對齊能夠提升訪問效率。爲使CPU可以對數據進行快速訪問,數據的起始地址應具備「對齊」特性。好比4字節數據的起始地址應位於4字節邊界上,即起始地址可以被4整除。學習
此外,合理利用字節對齊還能夠有效地節省存儲空間。但要注意,在32位機中使用1字節或2字節對齊,反而會下降變量訪問速度。所以須要考慮處理器類型。還應考慮編譯器的類型。在VC/C++和GNU GCC中都是默認是4字節對齊。
主要基於Intel X86架構介紹結構體對齊和棧內存對齊,位域本質上爲結構體類型。
對於Intel X86平臺,每次分配內存應該是從4的整數倍地址開始分配,不管是對結構體變量仍是簡單類型的變量。
在C語言中,結構體是種複合數據類型,其構成元素既能夠是基本數據類型(如int、long、float等)的變量,也能夠是一些複合數據類型(如數組、結構體、聯合等)的數據單元。編譯器爲結構體的每一個成員按照其天然邊界(alignment)分配空間。各成員按照它們被聲明的順序在內存中順序存儲,第一個成員的地址和整個結構的地址相同。
字節對齊的問題主要就是針對結構體。
3.1.1 簡單示例
先看個簡單的例子(32位,X86處理器,GCC編譯器):
【例1】設結構體以下定義:
已知32位機器上各數據類型的長度爲:char爲1字節、short爲2字節、int爲4字節、long爲4字節、float爲4字節、double爲8字節。那麼上面兩個結構體大小如何呢?
結果是:sizeof(strcut A)值爲8;sizeof(struct B)的值倒是12。
結構體A中包含一個4字節的int數據,一個1字節char數據和一個2字節short數據;B也同樣。按理說A和B大小應該都是7字節。之因此出現上述結果,就是由於編譯器要對數據成員在空間上進行對齊。
3.1.2 對齊準則
先來看四個重要的基本概念:
(1)數據類型自身的對齊值:char型數據自身對齊值爲1字節,short型數據爲2字節,int/float型爲4字節,double型爲8字節。
(2)結構體或類的自身對齊值:其成員中自身對齊值最大的那個值。
(3)指定對齊值:#pragma pack (value)時的指定對齊值value。
(4)數據成員、結構體和類的有效對齊值:自身對齊值和指定對齊值中較小者,即有效對齊值=min{自身對齊值,當前指定的pack值}。
基於上面這些值,就能夠方便地討論具體數據結構的成員和其自身的對齊方式。
其中,有效對齊值N是最終用來決定數據存放地址方式的值。有效對齊N表示「對齊在N上」,即該數據的「存放起始地址%N=0」。而數據結構中的數據變量都是按定義的前後順序存放。第一個數據變量的起始地址就是數據結構的起始地址。結構體的成員變量要對齊存放,結構體自己也要根據自身的有效對齊值圓整(即結構體成員變量佔用總長度爲結構體有效對齊值的整數倍)。
以此分析3.1.1節中的結構體B:
假設B從地址空間0x0000開始存放,且指定對齊值默認爲4(4字節對齊)。成員變量b的自身對齊值是1,比默認指定對齊值4小,因此其有效對齊值爲1,其存放地址0x0000符合0x0000%1=0。成員變量a自身對齊值爲4,因此有效對齊值也爲4,只能存放在起始地址爲0x0004~0x0007四個連續的字節空間中,符合0x0004%4=0且緊靠第一個變量。變量c自身對齊值爲2,因此有效對齊值也是2,可存放在0x0008~0x0009兩個字節空間中,符合0x0008%2=0。因此從0x0000~0x0009存放的都是B內容。
再看數據結構B的自身對齊值爲其變量中最大對齊值(這裏是b)因此就是4,因此結構體的有效對齊值也是4。根據結構體圓整的要求,0x0000~0x0009=10字節,(10+2)%4=0。因此0x0000A~0x000B也爲結構體B所佔用。故B從0x0000到0x000B共有12個字節,sizeof(struct B)=12。
之因此編譯器在後面補充2個字節,是爲了實現結構數組的存取效率。試想若是定義一個結構B的數組,那麼第一個結構起始地址是0沒有問題,可是第二個結構呢?按照數組的定義,數組中全部元素都緊挨着。若是咱們不把結構體大小補充爲4的整數倍,那麼下一個結構的起始地址將是0x0000A,這顯然不能知足結構的地址對齊。所以要把結構體補充成有效對齊大小的整數倍。其實對於char/short/int/float/double等已有類型的自身對齊值也是基於數組考慮的,只是由於這些類型的長度已知,因此他們的自身對齊值也就已知。
上面的概念很是便於理解,不過我的仍是更喜歡下面的對齊準則。
結構體字節對齊的細節和具體編譯器實現相關,但通常而言知足三個準則:
(1)結構體變量的首地址可以被其最寬基本類型成員的大小所整除;
(2)結構體每一個成員相對結構體首地址的偏移量(offset)都是成員大小的整數倍,若有須要編譯器會在成員之間加上填充字節(internal adding);
(3)結構體的總大小爲結構體最寬基本類型成員大小的整數倍,若有須要編譯器會在最末一個成員以後加上填充字節{trailing padding}。
對於以上規則的說明以下:
(1)編譯器在給結構體開闢空間時,首先找到結構體中最寬的基本數據類型,而後尋找內存地址能被該基本數據類型所整除的位置,做爲結構體的首地址。將這個最寬的基本數據類型的大小做爲上面介紹的對齊模數。
(2)爲結構體的一個成員開闢空間以前,編譯器首先檢查預開闢空間的首地址相對於結構體首地址的偏移是不是本成員大小的整數倍,如果,則存放本成員,反之,則在本成員和上一個成員之間填充必定的字節,以達到整數倍的要求,也就是將預開闢空間的首地址後移幾個字節。
(3)結構體總大小是包括填充字節,最後一個成員知足上面兩條之外,還必須知足第三條,不然就必須在最後填充幾個字節以達到本條要求。
【例2】假設4字節對齊,如下程序的輸出結果是多少?
執行後輸出以下:
下面來具體分析:
首先char a佔用1個字節,沒問題。
short b自己佔用2個字節,根據上面準則2,須要在b和a之間填充1個字節。
char c佔用1個字節,沒問題。
int d自己佔用4個字節,根據準則2,須要在d和c之間填充3個字節。
char e[3];自己佔用3個字節,根據原則3,須要在其後補充1個字節。
所以,sizeof(T_Test) = 1 + 1 + 2 + 1 + 3 + 4 + 3 + 1 = 16字節。
3.1.3.1 數據類型轉換
代碼中關於對齊的隱患,不少是隱式的。例如,在強制類型轉換的時候:
最後兩句代碼,從奇數邊界去訪問unsigned short型變量,顯然不符合對齊的規定。在X86上,相似的操做只會影響效率;但在MIPS或者SPARC上可能致使error,由於它們要求必須字節對齊。
又如對於3.1.1節的結構體struct B,定義以下函數:
在函數體內若是直接訪問p->a,則極可能會異常。由於MIPS認爲a是int,其地址應該是4的倍數,但p->a的地址極可能不是4的倍數。
若是p的地址不在對齊邊界上就可能出問題,好比p來自一個跨CPU的數據包(多種數據類型的數據被按順序放置在一個數據包中傳輸),或p是通過指針移位算出來的。所以要特別注意跨CPU數據的接口函數對接口輸入數據的處理,以及指針移位再強制轉換爲結構指針進行訪問時的安全性。
解決方式以下:
定義一個此結構的局部變量,用memmove方式將數據拷貝進來。
注意:若是能肯定p的起始地址沒問題,則不須要這麼處理;若是不能肯定(好比跨CPU輸入數據、或指針移位運算出來的數據要特別當心),則須要這樣處理。
用#pragma pack (1)將STRUCT_T定義爲1字節對齊方式。
3.1.3.2 處理器間數據通訊
處理器間經過消息(對於C/C++而言就是結構體)進行通訊時,須要注意字節對齊以及字節序的問題。
大多數編譯器提供內存對其的選項供用戶使用。這樣用戶能夠根據處理器的狀況選擇不一樣的字節對齊方式。例如C/C++編譯器提供的#pragma pack(n) n=1,2,4等,讓編譯器在生成目標文件時,使內存數據按照指定的方式排布在1,2,4等字節整除的內存地址處。
然而在不一樣編譯平臺或處理器上,字節對齊會形成消息結構長度的變化。編譯器爲了使字節對齊可能會對消息結構體進行填充,不一樣編譯平臺可能填充爲不一樣的形式,大大增長處理器間數據通訊的風險。
下面以32位處理器爲例,提出一種內存對齊方法以解決上述問題。
對於本地使用的數據結構,爲提升內存訪問效率,採用四字節對齊方式;同時爲了減小內存的開銷,合理安排結構體成員的位置,減小四字節對齊致使的成員之間的空隙,下降內存開銷。
對於處理器之間的數據結構,須要保證消息長度不會因不一樣編譯平臺或處理器而致使消息結構體長度發生變化,使用一字節對齊方式對消息結構進行緊縮;爲保證處理器之間的消息數據結構的內存訪問效率,採用字節填充的方式本身對消息中成員進行四字節對齊。
數據結構的成員位置要兼顧成員之間的關係、數據訪問效率和空間利用率。順序安排原則是:四字節的放在最前面,兩字節的緊接最後一個四字節成員,一字節緊接最後一個兩字節成員,填充字節放在最後。
舉例以下:
3.1.3.3 排查對齊問題
若是出現對齊或者賦值問題可查看:
編譯器的字節序大小端設置;
處理器架構自己是否支持非對齊訪問;
若是支持看設置對齊與否,若是沒有則看訪問時須要加某些特殊的修飾來標誌其特殊訪問操做。
3.1.4 更改對齊方式
主要是更改C編譯器的缺省字節對齊方式。
在缺省狀況下,C編譯器爲每個變量或是數據單元按其天然對界條件分配空間。通常地,能夠經過下面的方法來改變缺省的對界條件:
使用僞指令#pragma pack(n):C編譯器將按照n個字節對齊;
使用僞指令#pragma pack(): 取消自定義字節對齊方式。
另外,還有以下的一種方式(GCC特有語法):
__attribute((aligned (n))): 讓所做用的結構成員對齊在n字節天然邊界上。若是結構體中有成員的長度大於n,則按照最大成員的長度來對齊。
__attribute__ ((packed)):取消結構在編譯過程當中的優化對齊,按照實際佔用字節數進行對齊。
【注】__attribute__機制是GCC的一大特點,能夠設置函數屬性(Function Attribute)、變量屬性(Variable Attribute)和類型屬性(Type Attribute)。
下面具體針對MS VC/C++ 6.0編譯器介紹下如何修改編譯器默認對齊值。
VC/C++ IDE環境中,可在[Project]|[Settings],C/C++選項卡Category的Code Generation選項的Struct Member Alignment中修改,默認是8字節。
VC/C++中的編譯選項有/Zp[1|2|4|8|16],/Zpn表示以n字節邊界對齊。n字節邊界對齊是指一個成員的地址必須安排在成員的尺寸的整數倍地址上或者是n的整數倍地址上,取它們中的最小值。亦即:min(sizeof(member), n)。實際上,1字節邊界對齊也就表示結構成員之間沒有空洞。
/Zpn選項應用於整個工程,影響全部參與編譯的結構體。在Struct member alignment中可選擇不一樣的對齊值來改變編譯選項。
在編碼時,可用#pragma pack動態修改對齊值。具體語法說明見附錄5.3節。
自定義對齊值後要用#pragma pack()來還原,不然會對後面的結構形成影響。
【例3】分析以下結構體C:
變量b自身對齊值爲1,指定對齊值爲2,因此有效對齊值爲1,假設C從0x0000開始,則b存放在0x0000,符合0x0000%1= 0;變量a自身對齊值爲4,指定對齊值爲2,因此有效對齊值爲2,順序存放在0x0002~0x0005四個連續字節中,符合0x0002%2=0。變量c的自身對齊值爲2,因此有效對齊值爲2,順序存放在0x0006~0x0007中,符合0x0006%2=0。因此從0x0000到0x00007共八字節存放的是C的變量。C的自身對齊值爲4,因此其有效對齊值爲2。又8%2=0,C只佔用0x0000~0x0007的八個字節。因此sizeof(struct C) = 8。
注意,結構體對齊到的字節數並不是徹底取決於當前指定的pack值,以下:
另外,GNU GCC編譯器中按1字節對齊可寫爲如下形式:
此時sizeof(struct C)的值爲7。
在VC/C++中,棧的對齊方式不受結構體成員對齊選項的影響。老是保持對齊且對齊在4字節邊界上。
【例4】
結果以下:
能夠看出都是對齊到4字節。而且前面的char和short並無被湊在一塊兒(成4字節),這和結構體內的處理是不一樣的。
至於爲何輸出的地址值是變小的,這是由於該平臺下的棧是倒着「生長」的。
3.3.1 位域定義
有些信息在存儲時,並不須要佔用一個完整的字節,而只需佔幾個或一個二進制位。例如在存放一個開關量時,只有0和1兩種狀態,用一位二進位便可。爲了節省存儲空間和處理簡便,C語言提供了一種數據結構,稱爲「位域」或「位段」。
位域是一種特殊的結構成員或聯合成員(即只能用在結構或聯合中),用於指定該成員在內存存儲時所佔用的位數,從而在機器內更緊湊地表示數據。每一個位域有一個域名,容許在程序中按域名操做對應的位。這樣就可用一個字節的二進制位域來表示幾個不一樣的對象。
位域定義與結構定義相似,其形式爲:
其中位域列表的形式爲:
位域的使用和結構成員的使用相同,其通常形式爲:
位域容許用各類格式輸出。
位域在本質上就是一種結構類型,不過其成員是按二進位分配的。位域變量的說明與結構變量說明的方式相同,可先定義後說明、同時定義說明或直接說明。
位域的使用主要爲下面兩種狀況:
①當機器可用內存空間較少而使用位域可大量節省內存時。如把結構做爲大數組的元素時。
②當須要把一結構體或聯合映射成某預約的組織結構時。如須要訪問字節內的特定位時。
3.3.2 對齊準則
位域成員不能單獨被取sizeof值。下面主要討論含有位域的結構體的sizeof。
C99規定int、unsigned int和bool能夠做爲位域類型,但編譯器幾乎都對此做了擴展,容許其它類型的存在。位域做爲嵌入式系統中很是常見的一種編程工具,優勢在於壓縮程序的存儲空間。
其對齊規則大體爲:
(1)若是相鄰位域字段的類型相同,且其位寬之和小於類型的sizeof大小,則後面的字段將緊鄰前一個字段存儲,直到不能容納爲止;
(2)若是相鄰位域字段的類型相同,但其位寬之和大於類型的sizeof大小,則後面的字段將重新的存儲單元開始,其偏移量爲其類型大小的整數倍;
(3)若是相鄰的位域字段的類型不一樣,則各編譯器的具體實現有差別,VC6採起不壓縮方式,Dev-C++和GCC採起壓縮方式;
(4)若是位域字段之間穿插着非位域字段,則不進行壓縮;
(5)整個結構體的總大小爲最寬基本類型成員大小的整數倍,而位域則按照其最寬類型字節數對齊。
【例5】
位域類型爲char,第1個字節僅能容納下element1和element2,因此element1和element2被壓縮到第1個字節中,而element3只能從下一個字節開始。所以sizeof(BitField)的結果爲2。
【例6】
因爲相鄰位域類型不一樣,在VC6中其sizeof爲6,在Dev-C++中爲2。
【例7】
非位域字段穿插在其中,不會產生壓縮,在VC6和Dev-C++中獲得的大小均爲3。
【例8】
位域中最寬類型int的字節數爲4,所以結構體按4字節對齊,在VC6中其sizeof爲16。
3.3.3 注意事項
關於位域操做有幾點須要注意:
(1)位域的地址不能訪問,所以不容許將&運算符用於位域。不能使用指向位域的指針也不能使用位域的數組(數組是種特殊指針)。
例如,scanf函數沒法直接向位域中存儲數據:
intmain(void){structBitField1tBit;scanf("%d", &tBit.element2);//error: cannot take address of bit-field 'element2'return0;}
可用scanf函數將輸入讀入到一個普通的整型變量中,而後再賦值給tBit.element2。
(2)位域不能做爲函數返回的結果。
(3)位域以定義的類型爲單位,且位域的長度不可以超過所定義類型的長度。例如定義int a:33是不容許的。
(4)位域能夠不指定位域名,但不能訪問無名的位域。
位域能夠無位域名,只用做填充或調整位置,佔位大小取決於該類型。例如,char :0表示整個位域向後推一個字節,即該無名位域後的下一個位域從下一個字節開始存放,同理short :0和int :0分別表示整個位域向後推兩個和四個字節。
當空位域的長度爲具體數值N時(如int :2),該變量僅用來佔位N位。
【例9】
結構體大小爲3。由於element1佔3位,後面要保留6位而char爲8位,因此保留的6位只能放到第2個字節。一樣element3只能放到第3字節。
長度爲0的位域告訴編譯器將下一個位域放在一個存儲單元的起始位置。如上,編譯器會給成員element1分配3位,接着跳過餘下的4位到下一個存儲單元,而後給成員element3分配5位。故上面的結構體大小爲2。
(5)位域的表示範圍。
位域的賦值不能超過其能夠表示的範圍;
位域的類型決定該編碼能表示的值的結果。
對於第二點,若位域爲unsigned類型,則直接轉化爲正數;若非unsigned類型,則先判斷最高位是否爲1,若爲1表示補碼,則對其除符號位外的全部位取反再加一獲得最後的結果數據(原碼)。如:
(6)帶位域的結構在內存中各個位域的存儲方式取決於編譯器,既可從左到右也可從右到左存儲。
【例10】在VC6下執行下面的代碼:
輸入i值爲11,則輸出爲i = 11, cba = -2 -1 -1。
Intel x86處理器按小字節序存儲數據,因此bits中的位域在內存中放置順序爲ccba。當num.i置爲11時,bits的最低有效位(即位域a)的值爲1,a、b、c按低地址到高地址分別存儲爲十、一、1(二進制)。
但爲何最後的打印結果是a=-1而不是1?
由於位域a定義的類型signed char是有符號數,因此儘管a只有1位,仍要進行符號擴展。1作爲補碼存在,對應原碼-1。
若是將a、b、c的類型定義爲unsigned char,便可獲得cba = 2 1 1。1011即爲11的二進制數。
注:C語言中,不一樣的成員使用共同的存儲區域的數據構造類型稱爲聯合(或共用體)。聯合佔用空間的大小取決於類型長度最大的成員。聯合在定義、說明和使用形式上與結構體類似。
(7)位域的實現會因編譯器的不一樣而不一樣,使用位域會影響程序可移植性。所以除非必要不然最好不要使用位域。
(8)儘管使用位域能夠節省內存空間,但卻增長了處理時間。當訪問各個位域成員時,須要把位域從它所在的字中分解出來或反過來把一值壓縮存到位域所在的字位中。
讓咱們回到引言部分的問題。
缺省狀況下,C/C++編譯器默認將結構、棧中的成員數據進行內存對齊。所以,引言程序輸出就變成c1 -> 0, s -> 2, c2 -> 4, i -> 8。
編譯器將未對齊的成員向後移,將每個都成員對齊到天然邊界上,從而也致使整個結構的尺寸變大。儘管會犧牲一點空間(成員之間有空洞),但提升了性能。
也正是這個緣由,引言例子中sizeof(T_ FOO)爲12,而不是8。
總結說來,就是:
(1)在結構體中,綜合考慮變量自己和指定的對齊值;
(2)在棧上,不考慮變量自己的大小,統一對齊到4字節。
其實作爲一個編程學習者,有一個學習的氛圍跟一個交流圈子特別重要這裏我推薦一個C語言C++交流QQ羣1108152000,無論你是小白仍是轉行人士歡迎入駐,你們一塊兒交流成長。
微信公衆號:C語言編程學習基地